Dr Marek Kozłowski jest kierownikiem Laboratorium Inżynierii Lingwistycznej przy Ośrodku Przetwarzania Informacji Państwowego Instytutu Badawczego (OPI PIB). Laboratoria OPI prowadzą prace wdrożeniowe dla klientów publicznych i komercyjnych oraz badania naukowe nad szeroko rozumianą Sztuczną Inteligencją. Jest to jeden z niewielu podmiotów w Polsce budujący od zera modele języka naturalnego dla języka polskiego.

CzatGPT i Google Bard:

CzatGPT to wszechstronny czatbot, który generuje odpowiedzi na zapytania wprowadzane przez użytkownika. Może prowadzić rozmowę i angażować się w różne tematy, od ogólnych po określone obszary wiedzy. Usługa, tydzień po opublikowaniu, uzyskała 1 mln użytkowników. W styczniu z CzatGPT korzystało już 100 mln użytkowników (TikTok uzyskał 100 mln użytkowników po 9 miesiącach od premiery). Działanie czatbota wiąże się z bardzo dużymi kosztami obliczeniowymi. Do nauczenia i dostrojenia modeli stojących za usługą CzatGPT Open AI otrzymało od Microsoft Azure olbrzymie klastry kart graficznych – liczone na 10 tysięcy. Sam zakup mocy obliczeniowej dla usługi ChatGPT dla 1 miliona użytkowników dziennie to około 3 mln dolarów miesięcznie, a obecnie koszty te mogą przekraczać 10 mln dolarów. Na technologię Open AI odpowiedziało już Google zapowiadając Sztuczną Inteligencją o nazwie Bard. Przewagą technologii Googla ma być ciągły dostęp do wiedzy z wyszukiwarki Google (CzatGPT został wytrenowany na danych aktualnych do połowy 2021 roku, jednak jest stale uczony na podstawie odpowiedzi od jego użytkowników).
W naszej rozmowie dr Marek Kozłowski zauważa, że choć CzatGPT tworzy bardzo płynne odpowiedzi, musimy być świadomi, że nie zawsze są one podparte faktami, ponieważ Sztuczna Inteligencja jest w stanie „zmyślić” odpowiedź (zjawisko „halucynacji sztucznej inteligencji”). Google zapowiada, że w technologii Bard stawia na poprawność przekazywanych w odpowiedziach informacji i minimalizację tego zjawiska.

NLP (Przetwarzanie Języka Naturalnego):

Przetwarzanie języka naturalnego to gałąź Sztucznej Inteligencji, która umożliwia komputerom rozumienie języka człowieka oraz generowanie wypowiedzi w języku naturalnym. Techniki te wykorzystują m.in. asystenci wirtualni Siri i Alexa. Laboratorium Inżynierii Lingwistycznej jest jednym z dwóch laboratoriów OPI PIB badających zastosowanie technik NLP do tekstów w języku polskim (większość istniejących na świecie rozwiań opracowano dla języka angielskiego). Modele, które powstają w OPI PIB są dostępne publicznie i mogą być nieodpłatne wykorzystanie przez inne zespoły badawcze.

Autor: Karolina Pondel-Sycz, Fundacja Marsz dla Nauki