Druga wersja projektu nowelizacji ustawy o prawie autorskim i prawach pokrewnych (t.j. Dz.U. z 2022 r. poz. 2509 ze zm.) nie zakazuje trenowania generatywnych modeli sztucznej inteligencji na utworach udostępnianych w internecie przez polskich wydawców. Mówiąc wprost – AI będzie mogła się uczyć na artykułach z polskich gazet czy książek.

Ministerstwo Kultury i Dziedzictwa Narodowego dokonało pod tym względem zwrotu o 180 stopni – pod wpływem uwag zgłoszonych podczas konsultacji i uzgodnień międzyresortowych.

Projektowana nowela wdraża dyrektywę 2019/790 o prawie autorskim i prawach pokrewnych na jednolitym rynku cyfrowym (dalej: DSM). Unijne przepisy regulują m.in. kwestie eksploracji tekstów i danych na potrzeby badań naukowych (art. 3 dyrektywy DSM) i do celów innych niż badawcze (art. 4 DSM). Są to rodzaje dozwolonego użytku dotychczas nieuregulowane polskimi przepisami.

W pierwszym projekcie implementacji, opublikowanym 15 lutego br., MKiDN stwierdziło, że zwielokrotnianie utworów w ramach tych form dozwolonego użytku nie może służyć tworzeniu generatywnych modeli sztucznej inteligencji. Resort założył bowiem, że art. 3 i 4 DSM nie były pomyślane na potrzeby AI.

Po konsultacjach projektodawca usunął jednak z projektu te ograniczenia, „przychylając się do stanowiska, że zapis ten wykracza poza uregulowania dyrektywy DSM, a jego stosowanie może rodzić liczne wątpliwości interpretacyjne”.

W obecnej wersji przepisy dotyczące eksploracji tekstów i danych (tzw. TDM, z ang. text and data mining) w ramach dozwolonego użytku na potrzeby badań naukowych (projektowany art. 262 prawa autorskiego) umożliwiają TDM bez względu na wolę uprawnionego. Warunkiem wstępnym – zgodnie z motywem 14 dyrektywy – jest tylko legalny dostęp do treści. Ponadto celem eksploracji nie może być osiągnięcie korzyści majątkowej.

Z kolei TDM do celów innych niż badawcze (projektowany art. 263 prawa autorskiego) jest możliwy w celach komercyjnych i bez żadnych ograniczeń podmiotowych. W odniesieniu do tej formy dozwolonego użytku uprawniony może zabronić korzystania ze swojego utworu poprzez odpowiednie zastrzeżenie. W przypadku utworów udostępnionych w internecie należy je przedstawić w formacie nadającym się do odczytu maszynowego.

Reżim prawnoautorski

W ten sposób MKiDN usunęło z projektu rozwiązanie, które chwalili wydawcy prasy zrzeszeni w Izbie Wydawców Prasy (członkiem izby jest Infor PL) i Stowarzyszeniu Gazet Lokalnych. W konsultacjach obie izby podkreśliły, że podejście do komercyjnego TDM (art. 4 dyrektywy DSM) „jest w gruncie rzeczy wyrazem polityki państwa”. Może ona kształtować „reżim prawnoautorski w taki sposób, który tworzy właściwe warunki egzystencji dla twórców i producentów dóbr kultury” – albo przyjąć „optykę bezwzględnie sprzyjającą nieograniczonemu postępowi, której towarzyszy bezwzględne sięganie po cudzą twórczość”. Wydawcy przywołali tu „samowolne” działania globalnych firm technologicznych przy tworzeniu narzędzi typu ChatGPT czy Dall-E. „Kiedy w 2022 roku ujrzały one po raz pierwszy światło dzienne, stało się jasne, że – bez wiedzy, zgody czy rekompensaty – producenci narzędzi AI sięgnęli po niepoliczalną ilość utworów, również polskich” – stwierdzili.

Przeciwną postawę prezentowały firmy technologiczne. Google był np. zaniepokojony proponowanym wykluczeniem AI z nowych form dozwolonego użytku. „Projektowane przepisy skutkowałyby utrudnieniem badań naukowych w zakresie sztucznej inteligencji lub z jej wykorzystania, a także wypchnięciem innowacji w zakresie sztucznej inteligencji i związanych z nimi inwestycji z Polski do bardziej przyjaznych innowacjom systemów prawnych w Europie i poza nią. Mogłoby to mieć szkodliwy wpływ dla konkurencyjności Polski i utrudniło perspektywy wzrostu gospodarczego dzięki innowacjom technologicznym” – stwierdził big tech.

Także Ministerstwo Cyfryzacji skrytykowało przepisy na niekorzyść modeli generatywnych, podnosząc m.in., że uniemożliwią one rozwój planowanej współpracy w tej dziedzinie między Politechniką Wrocławską a Naukową i Akademicką Siecią Komputerową.©℗