ИИ предсказывает самые опасные мутации коронавируса и предлагает варианты терапии антителами
Ученые Швейцарской высшей технической школы Цюриха обучили систему ИИ предсказывать наиболее опасные мутации вируса SARS-CoV-2.
С точки зрения ИИ и сам вирус и его спайковый белок, которым вирус «зацепляется» за клетку-хозяина, это строчки символов. «Строчка» SARS-CoV-2 — это РНК из 30 тысяч нуклеотидов. В спайковый белок — это около 1200 аминокислот. Спайковый белок «зацепляется» за клетку, взаимодействуя с рецептором ACE2. ACE2 — это тоже строчка символов — около 800 аминокислот.
Когда иммунные клетки атакуют вирус, они его ищут по определенной сигнатуре — короткому отрезку символов, которому научили иммунитет вакцины и инфекции. Если во время мутации вирус эту сигнатуру меняет, иммунные клетки — промахиваются. И вирус получает свободу действий. Так случилось при прорывных инфекциях, когда вариант Omicron и его подварианты инфицировали и переболевших, и привитых. Иммунная система просто не видела нужную сигнатуру.
Но вирус не может меняться, как угодно. Он должен провзаимодействовать с рецептором ACE2. Если вирус мутирует слишком резко и не сможет зацепляться за рецептор, — он просто погибнет. Это накладывает на мутации серьезные ограничения. В результате, вирус при мутациях должен решить своего рода оптимизационную задачу. И зацепиться за рецептор, и уклониться от иммунитета. А вакцины и антительная терапия должны научиться отыскивать вирус даже после мутаций. Классическая задача — меч против щита.
Синтетическая эволюция
Даже если мы учтем ограничения, которые накладываются на мутации необходимостью связываться с рецептором ACE2, остается очень много допустимых вариантов. По оценке ученых, таких вариантов — десятки миллиардов. Мы не можем заготовить десять миллиардов вакцин для всех теоретически возможных мутаций коронавируса.
Значит надо обучить систему на всех доступных реальных и модельных вариантах спайкового белка, и попросить ИИ предсказать наиболее опасную мутацию.
Ученые так и поступили. Они использовали лабораторные эксперименты для создания большой коллекции мутантных вариантов спайкового белка SARS-CoV-2. Ученые не работали с живым вирусом, они воспроизводили только часть спайкового белка, поэтому не было опасности лабораторной утечки.
Спайковый белок взаимодействует с белком ACE2, инфицируя клетки. Антитела, образовавшиеся от вакцинации, в результате инфекции или терапии антителами блокируют этот механизм. Мутации гена, экспрессирующего срайковый белок, позволяют вирусу ускользать от иммунной системы.
Хотя коллекция мутантных вариантов, проанализированных исследователями, составляет лишь малую часть из нескольких миллиардов теоретически возможных вариантов, которые невозможно протестировать в лабораторных условиях, она содержит миллион таких вариантов.
Выполняя эксперименты с высокой пропускной способностью и секвенируя РНК из этих миллионов вариантов, исследователи определили, насколько успешно эти варианты взаимодействуют с белком ACE2 и уклоняются от существующих методов лечения антителами.
Исследователи использовали собранные данные для обучения моделей машинного обучения, которые способны выявлять сложные паттерны и при наличии только последовательности РНК нового варианта точно предсказать, может ли вариант связываться с ACE2 и уклониться от нейтрализующих антител. Окончательные модели машинного обучения теперь можно использовать для прогнозирования десятков миллиардов теоретически возможных вариантов с одиночными и комбинаторными мутациями, которые выходят далеко за пределы миллиона, проверенного в лаборатории.
Наиболее перспективным использованием полученных результатов ученые считают разработку новых методов лечения антителами.
ИИ пока ничем не помог в борьбе с пандемией. Но может быть, он поможет в следующий раз