Trenowanie modeli AI wymaga ogromnych ilości danych, które często obejmują treści chronione prawem autorskim. W Unii Europejskiej zdecydowano się zezwolić na zwielokrotnianie utworów do celów eksploracji tekstu i danych (text and data mining, TDM)1. Nie było od początku wiadome czy wyłączenie TDM ma zastosowanie w kontekście AI, ponieważ dyrektywa DSM nie wspomina o AI. Jednak zastosowanie tego wyłączenia nie wydaje się być w tej chwili kwestionowane.
Aby zrównoważyć interesy użytkowników i uprawnionych, wprowadzono mechanizm opt-out w przypadku stosowania TDM do celów innych niż badania naukowe2. Uprawnieni mogą zakazać wykorzystywania swoich utworów do celów TDM. Wymaga to wyraźnego zastrzeżenia „w odpowiedni sposób”, taki jak poprzez “środki nadające się do odczytu maszynowego w przypadku treści, które zostały podane do publicznej wiadomości w Internecie”.
Wdrożenie mechanizmu opt-out różni się w poszczególnych państwach członkowskich UE. Niektóre kraje (np. Polska) wymagają, aby zastrzeżenie było możliwe do odczytu maszynowego, jeżeli utwór jest dostępny online, z kolei inne (np. Włochy) – nie.
Niedawno opublikowano badanie zlecone przez EUIPO „The Development of Generative Artificial Intelligence from a Copyright perspective”3. Raport potwierdza, iż wdrożenie i skuteczność mechanizmów opt-out stanowi duże wyzwanie. Przykładowe wątpliwości prawne wokół opt-outu dotyczącego utworów dostępnych online obejmują takie pytania jak:
1. Czy zastrzeżenia dokonane w języku naturalnym (np. w regulaminie na stronie internetowej) zawsze spełniają kryterium nadawania się do „odczytu maszynowego”?
2. Czy organizacja zbiorowego zarządzania może dokonać skutecznego, ogólnego zastrzeżenia dotyczącego całego swojego repertuaru?
3. Czy licencjobiorca może dokonać skutecznego zastrzeżenia?
Co więcej, nie ma jednego, powszechnie przyjętego środka technicznego dla wyrażenia zastrzeżenia. Najpopularniejsze aktualnie to Robot Exclusion Protocol (robots.txt) i TDM Reservation Protocol. Ponieważ środki te mają istotne ograniczenia, opracowywane są nowe.
Warto zauważyć, iż nie istnieje urzędowe repozytorium klauzul opt-out stosowanych przez uprawnionych. Komisja Europejska zleciła przeprowadzenie badania mającego na celu ocenę zasadności wprowadzenia centralnego rejestru zastrzeżeń od TDM4.
Zgodnie z art. 53 (1) (c) AI Act5, dostawcy modeli AI ogólnego przeznaczenia (General-purpose AI models, GPAIM) są zobowiązani do wprowadzenia polityki służącej zapewnieniu m.in. respektowania opt-outów. Niedawno opublikowano trzeci projekt Kodeksu praktyk dla AI ogólnego przeznaczenia.6 Zobowiązano w nim ww. dostawców do korzystania z takich robotów indeksujących, które odczytują i stosują się do instrukcji wyrażonych w Robot Exclusion Protocol (robots.txt), zgodnym ze specyfikacją przyjętą przez Internet Engineering Task Force (IETF) zawartą w RFC (Request for Comments)7 nr 9309.
Dostawcy modeli AI ogólnego przeznaczenia muszą również dołożyć wszelkich starań, aby zidentyfikować i stosować się do innych protokołów podlegających odczytowi maszynowemu, stosowanych w celu wyrażenia opt-outu, przyjętych w wyniku międzybranżowego procesu ustalania norm lub takich, które są nowoczesne i szeroko stosowane przez uprawnionych.
Praktyka w tym zakresie wciąż się kształtuje. jeżeli uprawnieni zdecydują się na opt-out, powinni dokładnie rozważyć skuteczność stosowanych środków. Respektowanie klauzul opt-out od TDM jest również wyzwaniem dla dostawców modeli AI.
[1] Art. 3 i 4 Dyrektywy Parlamentu Europejskiego i Rady (UE) 2019/790 z dnia 17 kwietnia 2019 r. w sprawie prawa autorskiego i praw pokrewnych na jednolitym rynku cyfrowym („dyrektywa DSM”) (Dz.U. L 130 z 17.5.2019, ss. 92-125).
[2] Prowadzone przez ośrodki badawcze i instytucje dziedzictwa kulturowego.
[3] Rozwój generatywnej sztucznej inteligencji z perspektywy prawa autorskiego; dostępne tu: https://www.euipo.europa.eu/pl/publications/genai-from-a-copyright-perspective-2025.
[4] Więcej: https://op.europa.eu/pl/web/public-procurement/procurement-details/-/procurement/8726813a-bd9b-4f58-8679-01c80f7a1abf.
[5] Rozporządzenie Parlamentu Europejskiego i Rady (UE) 2024/1689 z dnia 13 czerwca 2024 r. w sprawie ustanowienia zharmonizowanych przepisów dotyczących sztucznej inteligencji („akt w sprawie sztucznej inteligencji”) (OJ L 2024/1689, 12.7.2024).