Может ли ИИ предсказать будущую эволюцию вирусов

Ученые в лабораториях всего мира работают с моделями ИИ, которые способны по РНК вируса определить траекторию его будущей эволюции. Если поиски приведут к успеху, можно будет разрабатывать вакцины и лекарства заранее и предупреждать вирусные пандемии.
Может ли ИИ предсказать будущую эволюцию вирусов
Трансмиссионная электронная микрофотография вирионов SARS-CoV-2 (красный), выделенных от пациента во время пандемии COVID-19. Википедия
Готовность к новой пандемии во многом определяется возможностью предсказать эволюцию вируса, просто взглянув на его генетическую последовательность. До этого еще далеко, но все больше исследовательских групп используют искусственный интеллект (ИИ) для прогнозирования эволюции SARS-CoV-2, гриппа и других вирусов.

Вирусы — особенно РНК-вирусы, такие как SARS-CoV-2, — постоянно эволюционируют, накапливая новые мутации. Некоторые из этих изменений выгодны вирусу. Они позволяют ему обходить иммунитет хозяина и быстро распространяться. Предсказывая эволюцию вируса, исследователи теоретически могут заранее разрабатывать вакцины и противовирусные препараты.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Сегодня инструменты ИИ могут предсказать, какие отдельные мутации в вирусе будут наиболее успешными и какие варианты «победят» в краткосрочной перспективе. Но ученые все еще далеки от того, чтобы предсказать комбинации мутаций, которые возникнут через длительное время.

Инструменты искусственного интеллекта

В прошлом исследователи проводили лабораторные эксперименты по выявлению будущих опасных вариантов вирусов, но такие методы трудоемки и занимают много времени. Некоторые группы, например лаборатория под руководством Юньлун Цао, иммунолога из Пекинского университета в Пекине, разработала инструменты, показывающие, как отдельные мутации влияют на способность вируса избегать обнаружения группой антител. Эти методы могут объяснить значительную часть вирусной эволюции, но далеко не всю.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

По словам Дэвида Робертсона, вирусолога из Университета Глазго (Великобритания), появление инструментов для предсказания структуры белков на основе ИИ, таких как AlphaFold, созданный лондонской компанией DeepMind дало новый импульс поискам.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Модели ИИ требуют огромного количества данных, чтобы предсказать эволюцию вирусов. Массовое секвенирование SARS-CoV-2, вируса, вызывающего COVID-19, сделало это возможным, говорит Джумпей Ито, биоинформатик из Токийского университета. Теперь у исследователей есть почти 17 миллионов последовательностей, которые они могут использовать для обучения своих моделей.

Структура и описание доменов спайкового белка SARS-CoV-2 и сохранение последовательностей у близкородственных коронавирусов.
Структура и описание доменов спайкового белка SARS-CoV-2 и сохранение последовательностей у близкородственных коронавирусов.
https://www.journalofinfection.com/article/S0163-4453%2824%2900055-0/fulltext
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Одна из моделей под названием EVEscape, разработанная Деборой Маркс из Гарвардской медицинской школы в Бостоне, штат Массачусетс, и ее командой, была использована для создания 83 возможных версий спайкового белка вируса SARS-CoV-2, который вирус использует для заражения клеток. Эти «аватары» спайковых белков могут обходить антитела, вырабатываемые людьми, которые прошли вакцинацию или заразились циркулирующими в настоящее время вариантами, и могут быть использованы для проверки эффективности будущих вакцин COVID-19.

Группа Ито сосредоточилась на способности вариантов вируса быстро распространяться в популяции и добиваться доминирования. Исследователи использовали ИИ-инструмент ESM-2 для создания модели под названием CoVFit, которая может предсказать относительную пригодность вариантов SARS-CoV-2. CoVFit обучена на 13 643 вариантах спайкового белка SARS-CoV-2, а также использует экспериментальные данные группы Цао о том, как отдельные мутации влияют на способность вируса избегать антител. Команда Ито создала ограниченную модель, обученную на данных о вариантах до августа 2022 года, и обнаружила, что она успешно предсказывает повышение пригодности некоторых вариантов после этого срока, включая XBB5, новый вариант, который появился в конце 2022 года.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

К марту 2024 года доминирующим вариантом SARS-CoV-2 во всем мире стал вариант под названием JN.1. Используя CoVFit, группа Ито определила три мутации, которые помогли бы JN.1 победить. Впоследствии эти мутации были обнаружены в вариантах, которые быстро распространяются по всему миру.

Большие скачки вирусной эволюции

РНК-вирусы, включая SARS-CoV-2, постоянно накапливают новые мутации.
РНК-вирусы, включая SARS-CoV-2, постоянно накапливают новые мутации.
Steve Gschmeissner/SPL
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Большинство этих моделей ограничены недостатком данных, а вирусы имеют практически безграничные возможности для эволюции, говорит Ито. Например, вариант Omicron появился на свет с более чем 50 мутациями, не похожими на то, что исследователи видели раньше.

Такие внезапные эволюционные скачки трудно предсказать. Робертсон и его коллеги пытаются найти способы использования моделей ИИ, чтобы лучше понять эти огромные эволюционные траектории и определить их пределы. Ученые обнаружили, что если дать ИИ-модели ESM-2 одну последовательность спайковых белков, то модель сможет определить области, в которых могут произойти изменения, и то, как эти изменения могут повлиять на другие области белка.

«Пока это похоже на какую-то черную магию», — говорит Робертсон. По его словам, цель состоит в том, чтобы определить, насколько велика возможность эволюции вируса на ранних стадиях после его обнаружения у людей.