Hurtowo kradli dane Google’a. A przy okazji rzucili cień na praktyki giganta

konto.spidersweb.pl 3 miesięcy temu

Google wypowiedział wojnę SerpApi – firmie z Austin, która według technologicznego giganta od lat żeruje na jego wyszukiwarce, obchodząc zabezpieczenia i masowo pozyskując dane chronione prawem autorskim.

Pozew złożony 19 grudnia w Sądzie Okręgowym dla Północnego Dystryktu Kalifornii to starcie o fundamenty współczesnego Internetu: kto ma prawo do danych i gdzie kończy się legalny dostęp, a zaczyna cyfrowe piractwo?

SerpApi – co to za firma i dlaczego Google chce ją zatrzymać?

SerpApi to narzędzie, które oferuje dostęp do wyników wyszukiwania Google poprzez własne API – interfejs, którego Google nigdy nie udostępnił publicznie. Firma stworzyła więc własne tylne wejście do wyszukiwarki, generując setki milionów zapytań, które dla systemów Google wyglądają jak działania zwykłych użytkowników.

Dla klientów SerpApi to wygodny sposób na analizę wyników wyszukiwania. Dla Google – masowe obchodzenie zabezpieczeń i kradzież treści, które są objęte licencjami, umowami i prawem autorskim.

Według pozwu SerpApi stworzyło cały arsenał technik pozwalających na obejście systemu SearchGuard – zabezpieczenia wprowadzonego przez Google w styczniu, które miało blokować automatyczne próby zbierania danych.

Wśród stosowanych metod znalazły się:

Fałszowanie danych o urządzeniach – zapytania wyglądają, jakby pochodziły z realnych telefonów czy komputerów.
Podszywanie się pod autoryzowane źródła – wykorzystanie legalnych tokenów i sesji, by zapytania wyglądały na autentyczne.
Obchodzenie CAPTCHA – automatyczne omijanie testów, które mają odróżniać ludzi od botów.
Sieci proxy – rozproszone serwery ukrywające prawdziwe źródło zapytań.

Google twierdzi, iż SerpApi wysyła setki milionów zapytań dziennie, a ich liczba wzrosła o 25 tys. proc. w ciągu dwóch lat. To skala, która może wpływać na stabilność całej wyszukiwarki.

Zgodnie z amerykańską ustawą DMCA każde naruszenie technologicznych zabezpieczeń może skutkować karą od 200 do 2500 dol. jeżeli Google udowodni, iż SerpApi dokonało miliardów takich naruszeń to potencjalne odszkodowania mogą przekroczyć wartość całej firmy – której roczne przychody szacowane są na kilka milionów dolarów.

Co tak naprawdę jest przedmiotem sporu?

Google argumentuje, iż jego wyniki wyszukiwania zawierają treści chronione prawem autorskim – zdjęcia, dane z Map Google, informacje z paneli wiedzy, oferty z Google Shopping. SerpApi, pozyskując te dane bez zgody podważa inwestycje Google w licencjonowanie i ochronę tych materiałów.

W tle tej sprawy czai się znacznie większy problem – głód danych w świecie sztucznej inteligencji. Modele AI potrzebują ogromnych zbiorów informacji do treningu. Setki firm, startupów i zespołów badawczych szukają sposobów na pozyskanie danych – często właśnie z wyszukiwarek.

SerpApi to tylko jedno z wielu narzędzi, które zasilają ten ekosystem. Ale jego działalność pokazuje, jak cienka jest granica między legalnym dostępem do informacji a naruszeniem prawa. W maju sąd w Albercie (Kanada) wydał wyrok w sprawie Clearview AI, który sugerował, iż trenowanie modeli AI na publicznie dostępnych danych może być legalne. Ale to inne państwo, inne prawo i inny kontekst.

Co to oznacza dla użytkowników?

Na pierwszy rzut oka sprawa wydaje się prosta – Google broni swojej własności intelektualnej. Ale w praktyce to znacznie bardziej złożony konflikt.

Z jednej strony jeżeli SerpApi rzeczywiście obchodziło zabezpieczenia na taką skalę to trudno dziwić się Google’owi, iż chce to zatrzymać. Fałszywe zapytania mogą destabilizować wyszukiwarkę i wpływać na jakość wyników.

Z drugiej strony fakt, iż Google stworzył system SearchGuard – który blokuje dostęp do danych publicznych – pokazuje, iż firma chce kontrolować nie tylko sposób wyszukiwania, ale też dostęp do samych wyników. To rodzi pytania o monopol informacyjny i zamykanie ekosystemu.

Jeśli Google wygra to SerpApi może zostać zmuszone do zakończenia działalności. Ale ważniejsze pytanie brzmi – czy w świecie, gdzie dane są nowym złotem powinniśmy pozwalać jednej firmie na tak ścisłą kontrolę nad dostępem do informacji? To debata, która dopiero się rozpoczyna.

Jej wynik może zdefiniować przyszłość otwartego Internetu.

Idź do oryginalnego materiału