AlpaFold3: вселенная белков получила инструмент, моделирующей ее динамику
С тех пор, как в 2021 году был выпущен мощный инструмент искусственного интеллекта AlphaFold2, ученые использовали эту ИИ-модель прогнозирования структуры белка, чтобы нанести на карту один из важнейших биологических механизмов, работающих в наших клетках. Ученые используют AlphaFold2 для поиска новых лекарств. Им удалось составить карту белковой вселенной, на которой отражены все известный белки — их описано уже 200 миллионов.
Несмотря на такие успехи, Джона Джампера, который возглавляет разработку AlphaFold в Google DeepMind в Лондоне, регулярно спрашивают, может ли этот инструмент сделать больше. Что в первую очередь интересует ученых? Как модифицировать белки, чтобы они изменяли свои функции и делали то, что нужно исследователям. Как белки изменяются при взаимодействии со структурами ДНК, РНК и другими белками. И вот с выходом новой версии модели AlphaFold2 на часть этих вопросов удалось ответить.
Новая версия AlphaFold и динамика белков
Последняя версия AlphaFold, описанная Nature должна дать ученым возможность предсказывать структуры белков во время взаимодействия с другими молекулами. Но если DeepMind предоставила версию инструмента 2021 года бесплатно и без ограничений, доступ к AlphaFold3 будет ограничен некоммерческим использованием через веб-сайт DeepMind.
AlphaFold2 предсказывает структуру белка по его аминокислотной последовательности с точностью, не уступающей экспериментальным методам (в том числе самому точному методу — рентгеноструктурному анализу)..По как будет работать белок зависит не только от его аминокислотного состава, но и от его трехмерной структуры. И AlphaFold позволил эту структуру получить очень быстро и очень дешево, по сравнению с другими методами.
В открытой базе данных AlphaFold хранятся структуры почти всех известных белков. Доступность кода AlphaFold2 также позволила другим исследователям легко использовать и модифицировать: одна из версий уже позволила предсказать взаимодействия между несколькими белками. Эта возможность уже включена в обновление AlphaFold2. Некоторые примеры взаимодействия белков с РНК и ДНК тоже были исследованы, но ученые хотели большего. Они хотели работать не отдельными белками, а со всей «вселенной белков».
Основное обновление
AlphaFold3 использует новую (по сравнению с AlphaFold2) сеть машинного обучения, — так называемую диффузионную модель. Такая модель уже стала традиционной при генерации изображений используется такими программами как Midjourney.
Ученые — особенно те, кто занят поиском новых лекарств — традиционно используют программное обеспечение для физического моделирования и проверки того, насколько хорошо химические вещества связываются с белками. AlphaFold3 оказался лучше других программ при моделировании этих процессов.
Команда Фрэнка Ульманн, биохимика из Института Фрэнсиса Крика в Лондоне получила возможность работать с AlphaFold3 одной из первых. Ученым удалось предсказать структуру белков, взаимодействующих с ДНК на этапе копирования генома, который предшествует делению клеток. Результат ученые оценили, как блестящий.
Ограниченный доступ
В отличие отAlphaFold2, ученые не смогут запустить собственную версию AlphaFold3, а код, лежащий в основе AlphaFold3 и полученный после обучения модели, не будет обнародован. Вместо этого исследователи получат доступ к «серверу AlphaFold3». Ученые смогут вводить выбранную ими белковую последовательность и набор дополнительных молекул. Ульман говорит: «Вы загружаете белок, и через 10 минут у вас есть структуры».
Но доступ к серверу AlphaFold3 ограничен. В настоящее время пользователи ограничены 10 предсказаниями в день. Кроме того, невозможно получить структуры белков, связанных с возможными лекарствами. «Мы должны найти баланс между доступность и безопасностью, в первую очередь при разработке лекарств», — говорит Пушмит Кохли, руководитель отдела исследований искусственного интеллекта DeepMind и соавтор исследования.
Тем не менее ученые полны оптимизма, и они надеются на скорое появление открытого кода AlphaFold3 Сергей Овчинников, биолог-эволюционист из Массачусетского технологического института разработал веб-версию AlphaFold2. Овчинников считает, что на разработку аналогичной версии AlphaFold3 не потребуется много времени: «Я ожидаю появления решений с открытым исходным кодом уже до конца года».