„Google nie jest demokratyczny. Wykorzystuje użytkowników” – wywiad o przyszłości internetu i projekcie Open Web Index

1 dzień temu

„Wyobraźmy sobie, iż nasze ulice nie miałyby nazw, a nasze domy nie miałyby czytelnych numerów. Byłby to tylko zaszyfrowany kod czytelny tylko dla maszyn” – mówi dr Stefan Voigt i pyta, dlaczego coś, co jest dla nas niedopuszczalne w świecie rzeczywistym, stało się powszechnie akceptowaną normą w świecie realnym. Są jednak ludzie, którzy chcą uczynić internet demokratycznym miejscem – to twórcy otwartego indeksu wyszukiwania.

Sylwia Błach: Czym dokładnie jest Open Search Foundation i jaka jest jej główna misja w kontekście tworzenia otwartej i przejrzystej wyszukiwarki?

Stefan Voigt: Open Search Foundation jest organizacją pozarządową non-profit, która aktywnie promuje europejską suwerenną i sfederowaną otwartą infrastrukturę wyszukiwania w sieci (ang. Open Web Search Infrastructure). w tej chwili ok. 80-90% wszystkich „klasycznych” wyszukiwań internetowych odbywa się za pośrednictwem Google. Podobny odsetek „wyszukiwań” informacji opartych na sztucznej inteligencji lub chat-botach prawdopodobnie trafia do „ChatGPT” OpenAI.

Jest to niebezpieczne dla cyfrowej i informacyjnej suwerenności i niezależności. Powoduje to również zagrożenia ekonomiczne. Na dłuższą metę stanowi choćby zagrożenie dla naszej demokracji, ponieważ uprzedzenia, podziały społeczne i polaryzacja są wnioskowane dzięki algorytmów, których nie można skontrolować ani zweryfikować i które są dostrojone w celu maksymalizacji zysków komercyjnych.

W ciągu ostatnich lat Open Search Foundation promowała europejską inicjatywę Open Web Search, do której przyłączyło się wielu partnerów, sympatyków i wiele projektów. w tej chwili pilotuje ona prototyp sfederowanego indeksu Open Web Index w Europie.

SB: Co to jest Open Web Index?

SV: Open Web Index jest zasadniczo ustrukturyzowaną i możliwą do filtrowania kopią dużych części Internetu. Jest to infrastruktura danych internetowych rozproszona w kilku publicznych i częściowo komercyjnych europejskich centrach obliczeniowych, która służy jako podstawa dla nowych europejskich wyszukiwarek. Mogą to być wyszukiwarki tematyczne, ogólne, osobiste i wiele, wiele innych. Ten indeks internetowy służy również jako podstawa dla innych usług internetowych, takich jak portale porównujące ceny lub dane wejściowe dla osobistego systemu rekomendacji, np. dla restauracji lub innych punktów zainteresowania.

Takie publiczne źródło danych internetowych na dużą skalę może być również wykorzystywane do budowania i obsługi osobistego i szanującego prywatność agenta AI na własnym komputerze, dzięki czemu nie musisz wysyłać wszystkich danych osobowych do zagranicznych hiperskalerów, którzy wykorzystują Twoje dane i informacje do wielu innych rzeczy, poza odpowiadaniem na Twoje pytania.

SB: Dlaczego ten projekt jest tak bardzo istotny dla obywateli?

SV: Pod względem cyfrowym Europa jest w tej chwili w dużej mierze zależna od kilku dużych firm technologicznych w USA i Chinach. Nie mamy prawie żadnej kontroli nad systemami operacyjnymi, na których pracują nasze komputery, nie mamy kontroli nad platformami mediów społecznościowych, routerami, sprzętem komputerowym ani usługami w chmurze, w których przechowujemy wszystkie nasze dane osobowe i przemysłowe. Co więcej, Europa nie ma choćby suwerennych i przejrzystych środków do orientacji i nawigacji w sieci. Jest to tym bardziej niebezpieczne, iż sfera cyfrowa staje się coraz ważniejsza i niezbędna dla naszej pracy, komunikacji, rozrywki, sztuki, kultury itp.

Dlatego musimy mapować sieć i udostępniać to mapowanie do użytku publicznego – tak jak mapujemy i nawigujemy w świecie fizycznym. Wyobraźmy sobie, iż nasze ulice nie miałyby nazw, a nasze domy nie miałyby czytelnych numerów. Byłby to tylko zaszyfrowany kod czytelny tylko dla maszyn. Wyobraźmy sobie również, iż nie byłoby map miast, atlasów, kompasów, systemów nawigacji satelitarnej ani informacji katastralnych o naszym otoczeniu. Tylko jedna firma, gdzieś na innym kontynencie, kontrolowana przez inną jurysdykcję i kierowana przez interesy handlowe, wiedziałaby, gdzie wszystko się znajduje.

A przy każdym ruchu, który chciałbyś wykonać poza domem, musiałbyś podać tej firmie wszystkie swoje dane osobowe: kim jesteś, dokąd chcesz się udać, kim są twoi przyjaciele, jaka jest twoja praca, jakie są twoje osobiste preferencje i poglądy polityczne – tylko po to, by znaleźć piekarnię kilka ulic dalej. Przypuszczam, iż nie spodobałoby ci się to, zwłaszcza, iż piekarnia musiałaby płacić dużo pieniędzy tej firmie, przez co twój chleb byłby znacznie droższy, tylko po to, byś mógł go znaleźć. Tak więc to, co uważamy za bardzo dziwne i niedopuszczalne w świecie fizycznym, jest dokładnie tym samym w świecie cyfrowym. Trzeba to naprawić. I właśnie dlatego potrzebujemy publicznego europejskiego indeksu internetowego i federacyjnej infrastruktury danych internetowych (ang. European Web Index and federated Web data infrastructure).

SB: Ta wizja brzmi strasznie, ale Twój projekt może wydawać się „kolejnym Googlem”. Wyjaśnij osobom niezaznajomionym z działaniem wyszukiwarek: czym różni się Twój projekt od, na przykład, Google i innych gigantów wyszukiwarek?

SV: Zauważ, iż Google i kilku innych gigantów wyszukiwarek ma w swoich centrach obliczeniowych kopię sieci. Wzięli oni tę kopię publicznego Internetu ze wszystkimi treściami, które zostały publicznie wyprodukowane (przez Ciebie i mnie oraz miliony innych współtwórców sieci), ukryli ją i teraz oddają nam małe kawałki tu i tam, ale tylko wtedy, gdy dostarczymy im mnóstwo prywatnych i osobistych informacji z naszych telefonów, lokalizacji, e-maili, zapytań wyszukiwania i jeżeli inni zapłacą im pieniądze za reklamę, aby wypaczać wyniki wyszukiwania tego, czego szukamy.

Musimy to zmienić. Dlatego też generujemy ustrukturyzowaną kopię sieci –Web Index – ale nie ukrywamy jej, generujemy ją jako dobro publiczne. Przejrzystą, możliwą do skontrolowania przez społeczeństwo, naukowców, bibliotekarzy – przez Ciebie i mnie. Udostępniamy tę kopię publicznie do użytku przez start-upy, badaczy, innowatorów, dziennikarzy itp., aby mogli z niej korzystać na uczciwych warunkach: do wyszukiwania i analizowania sieci, tworzenia usług, a także ofert komercyjnych, ale na zasadach uczciwego użytkowania i na małą i zróżnicowaną skalę. Ten publiczny indeks sieciowy, Web Index, umożliwia wielu małym firmom korzystanie z sieci jako zasobu; bez konieczności inwestowania w budowę wielu nowych centrów obliczeniowych, zanim będą mogły rozpocząć obsługę nowej usługi internetowej.

SB: Co leży u podstaw idei otwartej wyszukiwarki, zwłaszcza w świetle dominacji głównych komercyjnych graczy na rynku? Jak definiujecie „otwartość” w swoich projektach?

SV: Otwartość oznacza, iż infrastruktura danych sieciowych – lub indeks sieciowy – może być dostępna dla każdej firmy lub obywatela, każdego badacza lub organizacji publicznej. Oznacza to, iż algorytmy, które mapują (ang. index) i zbierają (ang. crawl) informacje internetowe są open source, a struktury danych do przechowywania wszystkich danych są publicznie sprawdzane i kontrolowane. Istnieje demokratyczny nadzór nad tą publiczną infrastrukturą i pozwala ona wielu osobom i podmiotom komercyjnym na budowanie na niej swoich usług. Tak jak korzystamy z publicznych ulic do celów osobistych lub komercyjnych. Tak jak korzystamy z publicznych dostaw wody lub energii elektrycznej lub biblioteki miejskiej w mieście itd.

SB: Jakie są główne wyzwania technologiczne, które napotykasz podczas budowania infrastruktury wyszukiwania opartej na otwartych standardach i jak sobie z nimi radzisz?

SV: Sieć jest duża, bardzo duża i jest w niej mnóstwo bzdur i spamu, które wymagają filtrowania i czyszczenia, zanim będzie można znaleźć istotne i przydatne informacje. Wiele osób uważa, iż zbudowanie tak dużego indeksu sieciowego jest zbyt dużym zadaniem i iż przegraliśmy z hiperskalerami w sieci. Ale zdecydowanie tak nie jest. Mamy wiele centrów obliczeniowych w Europie, mamy wielu inteligentnych ludzi i ekspertów! Tak więc jednym z głównych wyzwań jest zainspirowanie ludzi i dostawców usług obliczeniowych do współpracy nad tym dużym, ale niezwykle istotnym społecznie zadaniem i wspólne uczynienie informacji publicznej publicznie dostępną i ponownie użyteczną. W skali całej sieci! Nie w małych kawałkach dostępnych tu i tam.

Wygląda na to, iż robimy w tym zakresie spore postępy. Coraz więcej osób zaczyna popierać nasze podejście. Politycy omawiają ten pomysł i wprowadzają go do agendy politycznej, np. w Parlamencie Europejskim i parlamentach krajowych. Projekty zaczynają być finansowane, a interesariusze z branży zaczynają się angażować. Szczególnie, iż systemy „AI” – lepiej określane jako potężne statystyczne generatory tekstu – stają się tak popularne, wyzwaniem jest, aby agencje finansujące zrozumiały, iż te systemy AI potrzebują Peta-bajtów dobrze napisanego i zgodnego z prawem tekstu i informacji do szkolenia. Nawiasem mówiąc, tekst napisany przez ludzi wnosi inteligencję do tych systemów. Dobrze przefiltrowane i aktualne informacje internetowe również powstrzymują te systemy przed halucynacjami i zapewniają aktualność odpowiedzi. Wyzwaniem jest więc, aby ludzie zrozumieli, iż nie chodzi ani o „wyszukiwanie”, ani o „AI”, ale iż przyszłość to „AI-Search”.

SB: Jakie korzyści wynikają ze współpracy z instytucjami badawczymi, takimi jak DLR i innymi partnerami w projektach fundacji? Czy możesz podać przykłady, w których taka kooperacja doprowadziła do wymiernego postępu technologicznego?

SV: Istniały komercyjne próby konkurowania z dużymi dostawcami wyszukiwarek, ale nie miały one wytrzymałości ani woli współpracy, aby skalować się do znaczącego rozmiaru. Były zbyt skoncentrowane na szybkim zwrocie z inwestycji i poniosły porażkę. Obecnie organizacje publiczne, z którymi współpracujemy, mają społeczną i naukową perspektywę. Rozumieją, iż informacje i dane muszą być wolne w możliwym zakresie, aby służyć większemu dobru. Dlatego nie moglibyśmy zacząć bez tych dużych organizacji badawczych, takich jak DLR lub CERN, publicznych centrów obliczeniowych i uniwersytetów, aby faktycznie zbudować prototyp Web Index. Dopiero teraz, gdy mamy działający prototyp, zainteresowało się nim więcej komercyjnych graczy. To oczywiście dobrze, ale jednocześnie musimy upewnić się, iż rdzeń projektu pozostanie niedochodowy, otwarty i będzie dobrem publicznym. W tym celu musimy pozyskać dodatkowe środki, ale jestem optymistą, iż Europie się to uda.

SB: W jaki sposób otwarte wyszukiwarki promowane przez Open Search Foundation są zgodne z ideą demokratyzacji dostępu do informacji i wspierania suwerenności cyfrowej?

SV: jeżeli nie będziemy musieli prosić zagranicznych podmiotów komercyjnych o znalezienie informacji, aby zbudować sensowne usługi internetowe, znacznie zwiększy to suwerenność. jeżeli możemy budować systemy internetowe zgodnie z europejską kulturą, wartościami, językami i jurysdykcją, zwiększa to suwerenność. Jeśli uda nam się zbudować taką krytyczną infrastrukturę dla naszej europejskiej gospodarki i społeczeństwa w uczciwy i możliwy do skontrolowania sposób, tak aby mogła być sprawdzana i nadzorowana przez obywateli i naukowców, nazwałbym to demokratycznym. Google nie jest demokratyczny. Wykorzystuje użytkowników i tłumy i zarabia na tym mnóstwo pieniędzy.

SB: Jak fundacja postrzega problem koncentracji rynku wśród garstki gigantów wyszukiwarek? Czy widzisz realną szansę na alternatywę, która mogłaby zmienić obecne paradygmaty?

SV: Musimy doceniać i szukać mniejszych rzeczy i rozwiązań w sieci. To trudne, prawda, ale musimy dokonać tej zmiany paradygmatu. Często w sieci zwycięzca bierze wszystko. Musimy być gotowi na „powolne” jedzenie, a nie tylko „szybkie”. Również informacyjnie. Musimy cenić prywatność, różnorodność i indywidualność, także w usługach cyfrowych, z których korzystamy. jeżeli zaczniemy to robić, możemy znaleźć w sieci wiele świetnych rozwiązań open source, szanujących prywatność, napędzanych przez społeczność, suwerennych. To właśnie je możemy wspierać i pomagać w ich rozwoju, skalowaniu i rozkwicie dzięki sfederowanemu indeksowi otwartej sieci i sfederowanej infrastrukturze danych internetowych w Europie. I widzę, iż ta zmiana paradygmatu zaczyna się dziać. Szczególnie w danej sytuacji geopolitycznej i w czasach, gdy Europa musi stać się suwerenna cyfrowo.

SB: Co osobiście najbardziej inspiruje Cię w pracy z Open Search Foundation? Które projekty lub kierunki rozwoju uważasz za najważniejsze dla przyszłości otwartego i niezależnego dostępu do informacji online?

SV: Jest to wielki duch zespołowy i wola współpracy dla większego dobra, która wydaje się być w wielu, jeżeli nie we wszystkich, projektach, spotkaniach, sympozjach itp. w tym ruchu. Ludzie, którzy dołączają do inicjatywy, nie robią tego dla pieniędzy, robią to dla dobra sprawy i odzyskania sieci jako przestrzeni publicznej i demokratycznej.

Również interdyscyplinarny charakter tego przedsięwzięcia jest bardzo satysfakcjonujący. Mamy oczywiście wielu techników, ale jednocześnie mamy ekspertów ds. etyki, ludzi zajmujących się komunikacją, prawników, ekspertów biznesowych, polityków i wielu innych, którzy wnoszą swój wkład we współpracę i w znaczący sposób.

SB: Jak nasi czytelnicy mogą zaangażować się w Twój projekt?

SV: Przede wszystkim chciałbym podziękować za zaproszenie do podzielenia się naszą historią.

Szerzenie świadomości jest zawsze pierwszym krokiem! Ważne jest to, żeby rozwijać i wspierać otwarte i suwerenne wyszukiwanie w sieci, korzystanie z alternatywnych wyszukiwarek i alternatywne rozwiązania cyfrowe. To jest szczególnie ważne w sytuacji, kiedy cyfrowy świat staje się coraz szybszy i bardziej „realny” oraz wywiera większy wpływ, niż możemy sobie wyobrazić…

Źródło zdjęcia: archiwum prywatne

Idź do oryginalnego materiału