Uczenie maszynowe analizujące genomy wirusowe może przewidywać, jakie jest prawdopodobieństwo, że jakikolwiek wirus infekujący zwierzęta będzie zakażał także ludzi – informuje pismo “PLOS Biology”.
Większość nowo pojawiających się chorób zakaźnych ludzi (takich jak COVID-19) to choroby odzwierzęce. Badanie opublikowane przez Nardusa Mollentze, Simona Babayana i Daniela Streickera z University of Glasgow w Wielkiej Brytanii sugeruje, że uczenie maszynowe (rodzaj sztucznej inteligencji), wykorzystujące genomy wirusowe, może przewidzieć prawdopodobieństwo zakażenia ludzi wirusem zwierzęcym.
Wcześniejsze identyfikowanie wirusów wysokiego ryzyka może poprawić skuteczność badań i nadzoru.
Identyfikacja potencjalnych chorób odzwierzęcych jest poważnym wyzwaniem, ponieważ tylko niewielka mniejszość z około 1,67 miliona znanych wirusów zwierzęcych jest w stanie zakażać ludzi. Aby opracować modele uczenia maszynowego wykorzystujące sekwencje genomu wirusa, naukowcy najpierw skompilowali zestaw danych 861 gatunków wirusów z 36 rodzin. Następnie zbudowali modele uczenia maszynowego, które przypisywały prawdopodobieństwo infekcji człowieka na podstawie wzorców w genomach wirusów. Autorzy zastosowali najlepiej działający model do analizy wzorców dodatkowych genomów wirusów pobranych od różnych gatunków zwierząt.
Naukowcy odkryli, że genomy wirusowe mogą mieć dające się uogólnić cechy, które są niezależne od powiązań taksonomicznych wirusów i mogą umożliwiać wirusom zakażanie ludzi. Udało im się opracować modele uczenia maszynowego umożliwiające identyfikację potencjalnych chorób odzwierzęcych za pomocą genomów wirusowych. Modele te mają swoje ograniczenia, dlatego potrzebne będą potwierdzające testy laboratoryjne przed podjęciem dużych dodatkowych inwestycji badawczych. Ponadto - chociaż modele przewidują, czy wirusy mogą być w stanie zakażać ludzi - zdolność do zakażania jest tylko jedną z części szerszego ryzyka, na które wpływa również zjadliwość wirusa u ludzi, zdolność do przenoszenia między ludźmi i warunki ekologiczne w momencie narażenia człowieka.
Według autorów o potencjale wywołania choroby odzwierzęcej przez wirusa można w zaskakująco dużym stopniu wnioskować na podstawie sekwencji jego genomu. Typując wirusy o największym potencjale do wywołania chorób odzwierzęcych, ranking oparty na genomie pozwala bardziej skutecznie badać ich charakterystykę ekologiczną i wirusologiczną.
„Te odkrycia dodają kluczowy element do już zaskakującej ilości informacji, które możemy wydobyć z sekwencji genetycznej wirusów za pomocą technik sztucznej inteligencji” – dodaje Babayan.
"Sekwencja genomu jest zazwyczaj pierwszą i często jedyną informacją, jaką posiadamy na temat nowo odkrytych wirusów, a im więcej informacji możemy z niej wydobyć, tym szybciej możemy zidentyfikować pochodzenie wirusa i ryzyko transmisji chorób odzwierzęcych, jakie może on stwarzać. Im więcej wirusów zostanie scharakteryzowanych, tym skuteczniejsze staną się nasze modele uczenia maszynowego w identyfikowaniu rzadkich wirusów, które powinny być ściśle monitorowane i traktowane priorytetowo pod kątem prewencyjnego opracowywania szczepionek”.