- Wirtualne komórki AI. Po co to komu?
- Virtual Cell Challenge — nowe zasady gry, prawdziwy test
- Od równań do danych: krótka historia „całej komórki”
- Modele fundamentowe w biologii; Jeden model, który rządzi nimi wszystkimi
- Geneformer. 30 mln komórek, predykcje i weryfikacja CRISPR
Wyniki, które wyglądały świetnie w konferencyjnych prezentacjach, wypadają zaskakująco przeciętnie w testach porównawczych. Rok 2025 stał się rokiem prawdy: ruszył Virtual Cell Challenge, do którego zgłosiło się ponad tysiąc zespołów. Czy w jego ramach uda się zbudować wirtualny model komórki? Dowiemy się już 6 grudnia. Stawka? 100 tys. dolarów oraz odpowiedź na pytanie: co w tej układance naprawdę zadziała.
Wirtualne komórki AI. Po co to komu?
Wersja idealna jest kusząca. Modele komórkowe oparte na AI mogłyby: skracać ścieżkę od hipotezy do eksperymentu, wskazując najbardziej obiecujące modyfikacje genetyczne, mogłyby też symulować reakcje komórek na leki bez kosztów i ograniczeń mokrego laboratorium, służyć jako poligon doświadczalny w inżynierii komórkowej, wreszcie łączyć dane molekularne jednostki z jej „otoczeniem” — od sygnałów tkankowych po wpływ środowiska - wyliczają specjaliści, dodając przy tym, że takie odkrycie stałoby się wspólną platformą pracy dla biochemików, bioinformatyków i projektantów leków.
Virtual Cell Challenge — nowe zasady gry, prawdziwy test
W czerwcu ponad 20 badaczy, w tym Hani Goodarzi z Arc Institute, zainaugurowało Virtual Cell Challenge — konkurs, który ma sprawdzać modele AI na twardych danych i jasno zdefiniowanych zadaniach. Na debiut organizatorzy wybrali zadanie, które dotychczasowe symulacje „równaniowe” wykonywały słabo: przewidywanie efektów wyciszania genów w ludzkich embrionalnych komórkach macierzystych.
Zainteresowanie przeszło oczekiwania. Do rywalizacji zgłosiło się ponad 1000 zespołów — m.in. Cellamander, Zebulon Chow, SmartCell i Mean Predictors — a sponsorzy, w tym Nvidia, dołożyli 100 tys. dolarów. „Chcemy dowiedzieć się, co działa, a co nie” — mówi Goodarzi. 6 grudnia poznamy pełną tabelę wyników.
Jak wygląda protokół? Zespół Arc Institute przy użyciu CRISPR (ang. Clustered Regularly-Interspaced Short Palindromic Repeats, pol. zgrupowane, regularnie rozproszone, krótkie, powtarzające się sekwencje palindromiczne) wyłączył 300 genów (po jednym naraz) w ludzkich embrionalnych komórkach macierzystych i zmierzył wpływ na ekspresję pozostałych. Uczestnicy wyzwania trenują swoje modele na danych dotyczących 150 genów (plus wszelkie porównywalne zbiory publiczne), w rundzie wstępnej przewidują skutki wyłączenia 50 kolejnych genów. O zwycięstwie zadecyduje runda finałowa, gdzie na „ślepej” setce (100) genów - wskazują organizatorzy.
Od równań do danych: krótka historia „całej komórki”
Zanim nadeszła epoka AI, uczeni próbowali opisać komórkę równaniami. Już ćwierć wieku temu powstawały modele metabolizmu, syntezy białek czy replikacji DNA. Przełom przyszedł w 2012 r., gdy Jonathan Karr i współpracownicy z laboratorium Markusa Coverta na Stanfordzie zaprezentowali pierwszy model całej komórki — krzemową wersję Mycoplasma genitalium. Wybrano ją, bo ma ponad 500 genów (dla porównania E. coli ma ich ponad 4000). Model liczył stężenia 700 metabolitów w ramach 1100 reakcji chemicznych i odwzorowywał najważniejsze elementy: chromosom i rybosomy.
W 2022 r. zespół Zan Luthey-Schulten (University of Illinois) poszedł dalej: modelował minimalną komórkę zredukowaną do 493 genów w trzech wymiarach, korzystając z danych z kriogenicznej tomografii elektronowej. Cena realizmu? Symulacja 20 minut życia takiej komórki pochłaniała 8–10 godzin pracy zaawansowanych GPU.
To szkoła, w której modele „wiedzą” tyle, ile wpisze im twórca. I choć — jak zauważa Karr — świetnie przewidują krótkoterminową dynamikę (np. zmiany stężeń cząsteczek sekunda po sekundzie), pozostają ślepe na pytania najbardziej interesujące praktyków: co się stanie, gdy wyciszymy dany gen? Fabian Theis z Politechniki Monachijskiej podsumowuje ostro: stare podejście „Można śmiało powiedzieć, że całkowicie zawiodły” w tym typie przewidywań.
Modele fundamentowe w biologii; Jeden model, który rządzi nimi wszystkimi
Sztuczna inteligencja proponuje inną drogę: uczenie na ogromnych zbiorach eksperymentalnych bez narzucania równań. „Nie uczymy ich żadnej biologii” — podkreśla Steve Quake ze Stanfordu, współautor TranscriptFormera, modelu rozwijanego m.in. w Chan Zuckerberg Initiative (CZI).
Tak jak GPT-5 w języku, tak w biologii powstają modele fundamentowe: ogólne systemy, które potrafią od ręki wykonywać różne zadania (klasyfikować typy komórek, przewidywać skutki manipulacji genami, oceniać odpowiedzi na leki), a potem — w razie potrzeby — można je doszkolić do celów niszowych. „Jednym z modeli, który rządzi nimi wszystkimi, jest wizja” — mówi Theis.
Geneformer. 30 mln komórek, predykcje i weryfikacja CRISPR
Jednym z pierwszych była rodzina Geneformer, którą Christina Theodoris (UCSF) opisała w Nature w maju 2023 r. Cel był jasny: poprawić wcześniejszy, mniej wydajny system, który analizował sieci genowe i przewidywał skutki ich modyfikacji. W 2021 r. zespół Theodoris wskazał cząsteczkę o potencjale terapeutycznym w chorobie serca z nadmiernym wapniem w zastawkach — ale musiał ręcznie rekonstruować sieć genów. W Geneformer badaczka „chciała sprawdzić, czy możemy stworzyć model fundamentowy, który miałby podstawową wiedzę na temat sieci genów”.
Geneformer przetrenowano na pomiarach ekspresji z prawie 30 mln ludzkich komórek. Model nauczył się relacji między genami i potrafił wskazać, które z nich warto wyciszyć, by „odmłodzić” dysfunkcyjne komórki mięśnia sercowego. Co ważne, zespół poszedł krok dalej. Gdy CRISPR-em wyłączył dwa geny w hodowanych kardiomiocytach z mutacjami kardiomiopatii — siła skurczu wzrosła. To wskazówka, że leki hamujące te geny mogą mieć sens. Geneformer, konkluduje Theodoris, „może wskazać nowe kierunki i przyspieszyć odkrywanie leków”.
TranscriptFormer — 112 mln komórek, 12 gatunków
Na tle modeli uczonych wyłącznie na danych ludzkich TranscriptFormer wyróżnia się zakresem ewolucyjnym. Zespół Quake’a i Karaletsosa przygotował trzy wersje; najpełniejsza była trenowana na 112 mln komórek z 12 gatunków — od ludzi i myszy po nicienie, gąbki i pasożyta malarii. Dzięki temu model: lepiej klasyfikował rzadkie typy komórek niż scGPT (2024) i Geneformer, rozróżniał komórki płuc zakażone SARS-CoV-2 od zdrowych, przewidywał wpływ leków na komórki, radził sobie z klasyfikacją komórek gatunków nieobecnych w zbiorze treningowym.
I robił to bez dostrajania — w trybie zero-shot. „Wydajność TranscriptFormera pokazuje, jak ludzie mogliby używać takich narzędzi do odkrywania podstaw biologii” — podkreśla Theofanis Karaletsos.
CELLxGENE, lawina danych i… wąskie gardło
Paliwem dla tej rewolucji są dane — głównie ekspresja genów na poziomie pojedynczej komórki. Sama kolekcja CELLxGENE (CZI) liczy już ponad 35 mln komórek ludzkich i mysich. Tyle że to wciąż za mało i za mało „różnorodne”, by zasilić wszystko, czego chcą twórcy modeli. „Ograniczenia danych stanowią ogromną barierę dla modeli komórkowych” — mówi Karr. „Istnieje ograniczony zestaw pytań, na które możemy odpowiedzieć”.
Problemem jest też brak centralnego repozytorium na wzór Protein Data Bank (PDB), które umożliwiło rozwój np. AlphaFold (dwaj jego twórcy dostali Nobla z chemii w 2024 r.). W strukturach białek zadziałał standard wymuszony przez grantodawców i czasopisma: każdy nowy wynik trafia do PDB. W danych komórkowych takiego wymogu nie ma, a typów danych jest więcej i są różnorodne (transkryptomy, obrazy, metylacja, białka). „Nie da się scharakteryzować komórki za pomocą jednej technologii” — przypomina Karr.
Benchmarki i „zero-shot”: jak uczciwie mierzyć „inteligencję” modeli komórkowych?
Kolejny spór dotyczy oceny. Wielu twórców najpierw trenuje modele podstawowe, potem je dostraja do konkretnego zadania — i dopiero wtedy poddaje testom. Część badaczy uważa, że prawdziwa klasa ujawnia się w warunkach zero-shot: „Jeśli wnioskują na podstawie fundamentalnej wiedzy biologicznej, powinno to być prawdą, zanim dokonamy dostrajania” — mówi Theis. CZI opublikowało w tym roku narzędzia benchmarkowe, które mają ujednolicić porównania.
Zimny prysznic: gdy proste metody wygrywają
„Pomimo szumu medialnego, [te modele] nie sprawdzają się zbyt dobrze” — ocenia Alex Lu z Microsoft Research. W pracy opublikowanej na początku roku w Genome Biology zespół Lu i Kedzierskiej zestawił scGPT i Geneformer z prymitywniejszą AI i dwoma metodami nie-AI. Ku zaskoczeniu autorów, prostsze metody wygrały m.in. w klasyfikacji komórek.
Theodoris odpowiada, że testy musiały być łatwe, skoro poradziły z nimi sobie proste narzędzia — i nie wykorzystały pełni możliwości Geneformera.
W sierpniu w Nature Methods Constantin Ahlmann-Eltze doniósł z kolei, że prosty wzór matematyczny przewidywał reakcje poszczególnych genów na zmiany aktywności innych dokładniej niż pięć modeli fundamentalnych i dwa inne algorytmy AI. „Byłem bardzo zaskoczony. Sądząc po publikacjach, wszystkie wyglądały bardzo dobrze” — przyznał badacz.
„Nie rezygnowałbym z tych modeli”. Krytyka nie kończy wyścigu
Mimo chłodnych ocen badacze nie składają broni. „Nie rezygnowałbym z tych modeli. Ich awaria dostarcza nam wielu informacji” — podkreśla Kasia Kędzierska. Jej zdaniem pole szybko uczy się, co i jak mierzyć, a otwarte konkursy, jak Virtual Cell Challenge, przyspieszają dojrzewanie narzędzi. Goodarzi również studzi nastroje: konkurs zaprojektowano tak, by był trudny, a brak „pewniaka” ma wymusić prawdziwe innowacje.
Optymizm słychać też w sektorze biotechnologicznym. „Nie rozwiązaliśmy jeszcze problemu, ale [to podejście] jest bardzo obiecujące” — mówi Bo Wang, szef AI biomedycznej w Xaira Therapeutics. A Theofanis Karaletsos dodaje na koniec brutalnie szczere credo inżyniera: TranscriptFormer to „najgłupszy model, jaki kiedykolwiek zbudujemy”. Innymi słowy: to dopiero początek.
Niezbędnik danych: GPU, miliardy zmiennych i obrazowanie
Za kulisami dzieją się rzeczy prozaiczne i kosztowne. Symulacja 20 minut życia minimalnej komórki w wersji 3D potrafi zjeść 8–10 godzin na GPU klasy datacenter (koszt to od kilku do kilkunastu tysięcy dolarów za godzinę pracy). To mówi mówimy jednak o bakterii z 493 genami — nie o ludzkiej komórce z tysiącami elementów regulacyjnych. Wersje AI próbują przeskoczyć ten problem, ale same również są głodne danych i mocy obliczeniowej.
Kluczem będzie wyjście poza transkryptomikę (dziedzinę nauk biologicznych zajmującą się określeniem miejsca i czasu aktywności genów poprzez badanie transkryptomu). Obrazowanie na poziomie komórkowym (np. kriogeniczna tomografia elektronowa), proteomika, metylacja DNA, dostępność chromatyny — to wszystko musi trafić do wspólnego „płótna”, jeśli modele mają przewidywać morfologię, ruch, interakcje i czas.
AI-naukowcy: modele komórkowe jako „silniki” wirtualnych badaczy
Sama AI to nie tylko model komórki. To też naukowiec-asystent: wirtualny agent, który czyta literaturę, formułuje hipotezy, planuje eksperymenty i raportuje wyniki. Zestaw ponad 600 narzędzi opublikowany w tym roku przez Marinkę Zitnik i współpracowników pokazuje, jak takie „AI-laborki” mogą korzystać z fundamentów typu TranscriptFormer. Dzięki architekturze modelu, jak podkreślają autorzy, „wyniki pojawiają się szybciej i z większą dokładnością”.
Źródła:
- Materiały o Virtual Cell Challenge (Arc Institute; zapowiedź, protokół CRISPR, harmonogram z ogłoszeniem wyników 6 grudnia i nagrodą 100 tys. dolarów + GPU).
- Karr J. i zespół (2012): pierwszy model całej komórki (Mycoplasma genitalium): >500 genów, ~700 metabolitów, ~1100 reakcji.
- Luthey-Schulten Z. i współpracownicy (2022): model minimalnej komórki (493 geny), 3D, koszt 8–10 h GPU / 20 min symulacji.
- Theodoris C. (Nature, maj 2023): Geneformer (~30 mln ludzkich komórek); predykcje zweryfikowane CRISPR w kardiomiopatii.
- Quake S., Karaletsos T. (bioRxiv, 2025): TranscriptFormer (112 mln komórek, 12 gatunków); klasyfikacje, SARS-CoV-2, leki, zero-shot.
- CELLxGENE (CZI): kolekcja >35 mln komórek (ludzkich i mysich).
- Lu A., Kedzierska K. i in. (Genome Biology, 2025): porównania scGPT/Geneformer z prostszymi metodami.
- Ahlmann-Eltze C. i in. (Nature Methods, sierpień 2025): prosty wzór przewyższa pięć modeli podstawowych i dwa inne algorytmy AI w przewidywaniu reakcji genów.
- Wypowiedzi cytowane: Kasia Kedzierska; Hani Goodarzi; Alex Lu; Bo Wang; Fabian Theis; Theofanis Karaletsos; Steve Quake; Christina Theodoris.