Wydawcy europejscy chcą, aby sztuczna inteligencja mogła wykorzystywać ich treści do nauki tylko za opłatą. W Polsce sytuacja jest dodatkowo skomplikowana z powodu opóźnień w implementacji.

Na całym świecie wydawcy zabiegają o to, żeby twórcy rozwiązań bazujących na sztucznej inteligencji (z ang. AI) zaczęli płacić za wykorzystywanie dostępnych w internecie treści – np. artykułów prasowych – do trenowania systemów generatywnych (jak ChatGPT czy Bard).

Na poziomie Unii Europejskiej kwestię maszynowej analizy tekstu i danych reguluje dyrektywa 790/2019 (Digital Single Market; dalej: DSM). Pozwala ona korzystać do tego celu z materiałów chronionych prawem autorskim, do których posiada się legalny dostęp – chyba że właściciel praw zastrzeże brak zgody.

Jednak Polska dyrektywy jeszcze nie implementowała, więc nasza ustawa o prawie autorskim i prawach pokrewnych (t.j. Dz.U. z 2022 r. poz. 2509 ze zm., dalej: pr. aut.) takiej formy dozwolonego użytku nie przewiduje. Czy wobec tego wolno korzystać do treningu AI z treści dostępnych na polskich stronach internetowych?

Za zgodą lub bez

Jacek Wojtaś, koordynator ds. europejskich w Izbie Wydawców Prasy (jej członkiem jest też wydawca DGP), uważa, że wymaga to umowy licencyjnej z wydawcą. – Zgodnie z prawem obowiązuje monopol autorski, tzn. posiadacz praw musi wyrazić zgodę na korzystanie z treści. Wyjątkiem jest tylko dozwolony użytek. W przypadku AI nie widzę więc innej możliwości legalnego wykorzystywania treści niż uzyskanie zgody wydawców – uzasadnia prawnik. – Choć można się domyślać, że twórcy systemów AI omijają ten obowiązek – dodaje.

Michał Starczewski, radca prawny w kancelarii BWHS Wojciechowski Springer i Wspólnicy, zaznacza, że odpowiedź zależy od konkretnych okoliczności: rodzaju narzędzia AI, metody treningu, a w szczególności – czy wykorzystywane będą fragmenty, czy całości utworów; czy będą permanentnie przechowywane w bazie danych, czy tylko przejściowo – oraz od tego, jaki podmiot będzie korzystał z utworów.

Jak stwierdza, pod dozwolony użytek można zakwalifikować szkolenie narzędzia AI na swój osobisty użytek. Druga możliwość to art. 27 prawa autorskiego, tj. korzystanie z treści w celach dydaktycznych lub naukowych. – Jest on jednak dość wąski z punktu widzenia potrzeb budowy narzędzi AI – podkreśla prawnik. Dotyczy bowiem wyłącznie instytucji edukacyjnych i naukowych i korzystania tylko w takim celu. Ponadto – z wyjątkiem drobnych utworów – pozwala na zwielokrotnianie utworów jedynie we fragmentach.

– Te ograniczenia mogą być zbyt daleko idące dla twórców narzędzi AI, a przez to niewystarczające – uważa Michał Starczewski. Jego zdaniem poprawne wdrożenie dyrektywy DSM da znacznie lepszą podstawę do korzystania z utworów w celu trenowania AI, także przez podmioty komercyjne.

Jak powiedzieć „nie”

Polskie opóźnienie z wdrożeniem unijnych przepisów może mieć skutki uboczne. – Dyrektywy są skierowane do państw, ich adresatami nie są podmioty prywatne. Mamy jednak orzecznictwo Trybunału Sprawiedliwości Unii Europejskiej dotyczące sytuacji, kiedy jakieś państwo zwleka z wdrożeniem dyrektywy do prawa krajowego – mówi Tomasz Zalewski, radca prawny, partner w kancelarii Bird & Bird.

Wtedy można jej regulacje stosować bezpośrednio, o ile się do tego nadają. Czy wspomniane przepisy DSM można bezpośrednio zastosować? – Wydaje mi się, że tak, jednak tylko przeciwko państwu polskiemu – odpowiada Tomasz Zalewski. – A to oznacza, że gdyby podmiot korzystający z treści do uczenia AI został za to pozwany, mógłby dochodzić odszkodowania od państwa polskiego, powołując się na przepisy dyrektywy – stwierdza.

Nawet dyrektywa DSM nie rozwiewa jednak wszystkich wątpliwości w tej dziedzinie.

– Dyrektywa stanowi, że brak zgody należy zastrzec w sposób dający się odczytać maszynowo, ale nie przedstawia konkretnych rozwiązań – mówi Jacek Wojtaś. Jego zdaniem postanowienie w regulaminie strony spełnia ten warunek.

Tomasz Zalewski zwraca uwagę, że standard umieszczania w kodzie strony komunikatu dla robotów oznaczającego „nie indeksuj” przyjął się w ramach dobrych praktyk w odniesieniu do indeksowania stron przez wyszukiwarki. – Nie ma na razie podobnego standardu dla web scrapingu. Zanim zostanie wytworzony, to chyba najlepiej umieszczać takie zastrzeżenie właśnie w regulaminie strony – zgadza się Tomasz Zalewski.

Poprawianie prawa

Kwestią otwartą pozostaje też odpłatność za wykorzystanie dostępnych w sieci materiałów do trenowania AI.

– To zależy od charakteru treści na danej stronie internetowej. Jeżeli można je uznać za utwory podlegające ochronie prawa autorskiego, to za korzystanie z nich przysługuje wynagrodzenie, chyba że odbywa się to w ramach dozwolonego użytku – uważa Tomasz Zalewski.

Zaznacza jednak, że pojawia się tu wiele pytań. Przede wszystkim, czy rzeczywiście mamy do czynienia z utworami? Czy pobierana jest cała zawartość strony, czy tylko fragmenty? Czy można uznać daną stronę za bazę danych i skorzystać z niej na zasadzie dozwolonego użytku?

– Ponadto dane do uczenia AI nie są właściwie kopiowane, tylko służą w ramach uczenia maszynowego do modyfikacji parametrów wag w sieciach neuronowych. Czasami dochodzi do odtworzenia wiernej kopii oryginalnego materiału, ale twórcy systemów AI starają się eliminować takie przypadki – zastrzega Tomasz Zalewski. Innym pytaniem jest to, czy wykorzystanie utworu do szkolenia sztucznej inteligencji stanowi nowe pole eksploatacji.

Jacek Wojtaś informuje, że według IWP wykorzystanie utworów dostępnych w sieci do szkolenia AI powinno się odbywać za opłatą. – Model biznesowy wydawców obejmuje wpływy ze sprzedaży reklam i ze sprzedaży treści – podkreśla.

O jakie kwoty chodzi, branża na razie nie jest w stanie oszacować.

– Wydawcy europejscy będą zabiegać, aby kluczowe kwestie dotyczące wykorzystania ich treści do szkolenia AI dodano do aktu o AI (unijnego rozporządzenia mającego regulować AI – red.) – mówi Jacek Wojtaś. Regulacja jest już w fazie trialogu. – Prace nad nią zaczęły się dwa lata temu i w tym czasie wiele się zmieniło. Gdyby akt wszedł w życie w obecnej wersji, już na starcie okazałby się przestarzały. Dlatego mamy nadzieję, że PE, Rada i KE wyjątkowo wyjdą poza stanowiska, z jakimi przystąpiły do trialogu – stwierdza.

Wydawcy zabiegają przede wszystkim o zapis, że trenowanie sztucznej inteligencji może się odbywać tylko za zgodą uprawnionego do danych treści i z zapewnieniem mu rekompensaty. Chcą też, by teksty tworzone przez AI były oznakowane, chyba że przed publikacją modyfikuje je jeszcze dziennikarz. ©℗

ikona lupy />
Oswajanie narzędzi AI / Dziennik Gazeta Prawna - wydanie cyfrowe