Organizacja branżowa – do której należy także Infor PL, wydawca DGP – rekomenduje swoim członkom, aby uzupełnili regulaminy korzystania z treści na ich stronach internetowych wydawców o specjalne zastrzeżenie chroniące te treści przed niekontrolowanym dostępem AI. Zgodnie z nim zwielokrotnianie publikowanych przez danego wydawcę utworów - w tym systematyczne ich pobieranie przy użyciu oprogramowania lub innego zautomatyzowanego systemu (tzw. web scraping) - w celu eksploracji tekstu i danych (TDM, od: text and data mining) jest niedozwolone bez wyraźnej zgody wydawcy. W szczególności chodzi o korzystanie z publikacji prasowych do szkolenia systemów uczenia maszynowego lub sztucznej inteligencji.
Nowe prawo autorskie zmieniło zasady gry
Wiąże się to z unijną dyrektywą 790/2019 w sprawie prawa autorskiego i praw pokrewnych na jednolitym rynku cyfrowym (dyrektywa DSM). Polska implementowała ją w nowelizacji ustawy o prawie autorskim i prawach pokrewnych (tj. Dz.U. z 2024 r. poz. 1254). Wśród nowych rozwiązań znalazła się forma dozwolonego użytku w celu eksploracji tekstów i danych.
W pierwszej wersji projektu nowelizacji prawa autorskiego resort kultury zapisał, że dozwolony użytek TDM nie może służyć tworzeniu generatywnych modeli AI. Później jednak to rozwiązanie usunięto. W rezultacie z publicznie dostępnych w internecie utworów można korzystać także do trenowania AI – chyba że właściciel praw (podmiot uprawniony) dokona zastrzeżenia, wyłączając swoje dzieła spod reguły dozwolonego użytku TDM (tzw. opt-out). Taką funkcję ma pełnić udostępniony przez IWP plik.
Izba Wydawców Prasy ostrzega
Izba argumentuje, że zastrzeżenie „jest konieczne, szczególnie wobec rozwoju systemów AI, które uczone są na treściach prasowych”. Opt-out daje szansę na licencjonowanie korzystania z publikacji prasowych i pobieranie z tego tytułu opłat od podmiotów trenujących modele sztucznej inteligencji. „W przeciwnym razie masowe korzystanie z treści prasowych nie zostanie ograniczone, a wytrenowane na dziennikarskiej twórczości modele AI wkrótce zastąpią potrzebę wykorzystywania publikacji prasowych” – ostrzega IWP.
Do podobnego działania, wtedy jeszcze niezwiązanego z AI, izba zmobilizowała wydawców w 2015 r., gdy opracowano „Notę wydawniczą” – tj. regulamin korzystania z artykułów prasowych. Funkcjonujące do dziś zastrzeżenie ma chronić prawa autorskie wydawców do treści prasowych, m.in. poprzez określenie ram, rozmiarów czy zakresów, w których można korzystać z utworów na zasadzie dozwolonego użytku.
Jakie zastrzeżenie może zatrzymać sztuczną inteligencję
W Europie nie ukształtował się jeszcze standard zastrzeżeń skutecznie powstrzymujących sztuczną inteligencję przed bezumownym korzystaniem z chronionych utworów. Polska ustawa w ślad za dyrektywą DSM stwierdza, że w przypadku udostępniania online „zastrzeżenia dokonuje się w formacie przeznaczonym do odczytu maszynowego”. Zastrzeżenie dokonane w regulaminie serwisu, w języku naturalnym, za wystarczające uznał we wrześniu ub.r. sąd w Hamburgu w sporze pomiędzy autorem zdjęć udostępnionych w internetowej bazie a organizacją szkolącą AI. Jak stwierdził sąd, skoro podmioty rozwijające AI korzystają z dozwolonego użytku, by tworzyć coraz potężniejsze modele rozumiejące treści – to można oczekiwać, że użyją już istniejącej technologii AI do odczytania zastrzeżenia dokonanego w języku naturalnym, używanym przez ludzi (sprawa 310 O 227/23).
O uregulowanie kwestii karmienia AI redakcyjnymi treściami zabiegają też wydawcy za oceanem. Np. wydawca „The New York Times” jeszcze w grudniu 2023 r. pozwał Microsoft i OpenAI za bezprawne kopiowanie artykułów gazety przez ChatGPT.
Pisaliśmy o tym
„ZAiKS kontra AI” DGP nr 24/2025