Serwisy lead generation dla ubezpieczeń zdrowotnych sprzedają dane użytkowników w kilka sekund

2 miesięcy temu

Wprowadzenie do problemu / definicja

Rynek lead generation w sektorze ubezpieczeń zdrowotnych od lat opiera się na pozyskiwaniu danych kontaktowych osób zainteresowanych polisami. Najnowsze ustalenia pokazują jednak, iż problem wykracza poza standardowy marketing: dane osobowe oraz informacje mogące ujawniać stan zdrowia bywają przechwytywane jeszcze przed formalnym wysłaniem formularza, a następnie błyskawicznie trafiają do kolejnych podmiotów.

Z perspektywy cyberbezpieczeństwa oznacza to niekontrolowaną dystrybucję danych wrażliwych, ograniczoną przejrzystość łańcucha przetwarzania oraz realne ryzyko nadużyć telemarketingowych i profilowania. Użytkownik, który chce jedynie porównać oferty, może uruchomić cały ekosystem pośredników handlujących jego danymi niemal w czasie rzeczywistym.

W skrócie

Badacze przeanalizowali 105 serwisów generujących leady dla rynku ubezpieczeń zdrowotnych i utworzyli 210 kontrolowanych profili testowych z unikalnymi numerami telefonów oraz adresami e-mail. Ustalili, iż dane trafiały do dziesiątek podmiotów trzecich, często jeszcze przed kliknięciem przycisku wysyłki formularza.

odnotowano 8214 połączeń przychodzących z 1240 różnych numerów,
78% profili otrzymało co najmniej jeden telefon,
połowa pierwszych połączeń pojawiała się w ciągu dwóch minut od przesłania formularza,
około 70% badanych serwisów ujawniało dane osobowe również poprzez adresy URL,
dane osobowe trafiły łącznie do 73 różnych podmiotów trzecich.

Wyniki wskazują na systemowy model monetyzacji danych, a nie pojedynczy incydent czy błąd wdrożeniowy.

Kontekst / historia

Ekosystem lead generation od dawna funkcjonuje w branżach wysokomarżowych, takich jak ubezpieczenia, kredyty czy usługi medyczne. Operatorzy witryn zbierają dane użytkowników, przekazują je agregatorom, a ci odsprzedają rekordy kolejnym nabywcom, niekiedy wielokrotnie. W praktyce jeden formularz może uruchomić falę połączeń, wiadomości i dalszego profilowania.

W analizowanym przypadku badacze z uczelni w USA i Europie prześledzili ten proces end-to-end na stronach oferujących wyceny ubezpieczeń zdrowotnych. Ich wnioski pokazują, iż problem wynika zarówno z architektury technicznej samych serwisów, jak i z modelu biznesowego opartego na natychmiastowej odsprzedaży leadów bez skutecznej kontroli dalszego wykorzystania informacji.

Analiza techniczna

Najbardziej niepokojące ustalenie dotyczyło sposobu działania skryptów firm trzecich osadzonych na stronach. W wielu przypadkach nasłuchiwały one zdarzeń JavaScript i przechwytywały zawartość pól formularza jeszcze przed jego formalnym zatwierdzeniem. Oznacza to możliwość pozyskania imienia, nazwiska, numeru telefonu, adresu e-mail, a choćby informacji związanych ze zdrowiem, zanim użytkownik świadomie zdecyduje o wysłaniu danych.

Drugim istotnym kanałem wycieku była błędna konstrukcja aplikacji webowych. Około 70% badanych serwisów umieszczało dane osobowe bezpośrednio w adresie URL po przesłaniu formularza. jeżeli na stronie działały narzędzia analityczne, reklamowe lub inne zewnętrzne integracje, informacje mogły być przekazywane dalej między innymi przez nagłówki referrer, logi i systemy śledzące.

Badacze wykazali także, iż zakup leadów w tym ekosystemie nie wymagał rzetelnej weryfikacji celu biznesowego ani uprawnień do przetwarzania informacji. W testowanych modelach sprzedaży — bezpośrednio przez generator leadów, przez agregatora oraz przez brokerów handlujących starszymi rekordami — brakowało istotnych mechanizmów kontroli nabywców.

Szczególnie wymowny był przypadek odkupu własnego profilu testowego niemal w czasie rzeczywistym za niewielką kwotę. Pokazuje to, jak krótki jest odstęp pomiędzy wpisaniem danych do formularza a ich komercjalizacją na rynku pośredników.

Konsekwencje / ryzyko

Ryzyko ma charakter wielowarstwowy. Po pierwsze, ekspozycji ulegają dane osobowe i informacje mogące ujawniać stan zdrowia, co otwiera drogę do agresywnego marketingu, profilowania i potencjalnych nadużyć. Po drugie, wielokrotna odsprzedaż tych samych rekordów powoduje lawinę kontaktów handlowych, nad którymi użytkownik praktycznie nie ma kontroli.

Skala zjawiska była wyraźna: część profili otrzymywała setki, a choćby tysiące połączeń w ciągu 60 dni. Znaczna część ruchu pochodziła z infrastruktury VoIP, a identyfikatory połączeń sugerowały stosowanie technik zwiększających szansę odebrania rozmowy, w tym dopasowywanie numerów do lokalnego prefiksu odbiorcy.

Z perspektywy zgodności i bezpieczeństwa szczególnie problematyczne są nieskuteczne mechanizmy opt-out. o ile lead jest wielokrotnie sprzedawany, rezygnacja z kontaktu u jednego podmiotu nie oznacza automatycznego zatrzymania połączeń i wiadomości od kolejnych nabywców. To prowadzi do rozszczelnienia zarządzania zgodą i utraty kontroli nad cyklem życia danych.

Dodatkowym zagrożeniem jest jakość rekordów. jeżeli brokerzy uzupełniają brakujące informacje syntetycznie lub na podstawie innych źródeł, może to skutkować błędnym profilowaniem, nieprawidłową oceną klienta i decyzjami biznesowymi podejmowanymi na podstawie danych, których użytkownik nigdy nie podał.

Rekomendacje

Organizacje obsługujące formularze leadowe powinny traktować je jak systemy przetwarzające dane wysokiego ryzyka. W praktyce oznacza to konieczność pełnego przeglądu skryptów zewnętrznych, ograniczenia liczby partnerów technologicznych oraz wdrożenia zasady minimalizacji danych.

blokowanie nieautoryzowanych skryptów dzięki restrykcyjnej polityki Content Security Policy,
eliminację umieszczania danych osobowych w adresach URL,
przesyłanie informacji identyfikujących wyłącznie w bezpiecznym body żądania,
monitoring exfiltracji danych po stronie przeglądarki,
testy prywatności i DLP dla formularzy webowych,
regularne przeglądy integracji martech i adtech,
weryfikację partnerów odbierających leady pod kątem podstawy prawnej, celu przetwarzania i retencji danych,
utrzymywanie mapy przepływu danych oraz rejestru odbiorców.

Istotne jest również zapewnienie skutecznego mechanizmu propagowania decyzji użytkownika o wycofaniu zgody w całym łańcuchu przetwarzania. Sam formularz rezygnacji nie wystarczy, o ile organizacja nie kontroluje dalszej odsprzedaży rekordu i nie potrafi udokumentować, gdzie trafiły dane.

Podsumowanie

Opisane ustalenia pokazują, iż serwisy lead generation dla ubezpieczeń zdrowotnych mogą działać jak mechanizm natychmiastowej monetyzacji danych osobowych i informacji związanych ze zdrowiem. Problem zaczyna się już na poziomie front-endu, gdzie dane bywają przechwytywane przed wysłaniem formularza, a następnie eskaluje przez odsprzedaż rekordów i słabą kontrolę nad nabywcami.

Dla branży cyberbezpieczeństwa to istotny sygnał ostrzegawczy. Ochrona prywatności w aplikacjach webowych nie może ograniczać się do szyfrowania transmisji i banerów cookies. najważniejsze stają się kontrola skryptów firm trzecich, bezpieczeństwo przepływów danych oraz nadzór nad całym łańcuchem przetwarzania informacji.