Вселенная белков. Создается база данных 3D-структур 200 миллионов белков почти всех живых организмов

Исследователи компании DeepMind (подразделение Google) с помощью нейросети AlphaFold намерены описать 3D-структуру почти 200 миллионов белков. Эти белки работают в клетках 1 миллиона видов, охватывающих почти все известные белки на планете. Данные будут загружены в открытую базу данных. Еще два года назад, чтобы получить 3D-структуру всего одного белка нужны были месяцы работы ученых и дорогостоящее оборудование. Теперь достаточно послать запрос к базе.
Вселенная белков. Создается база данных 3D-структур 200 миллионов белков почти всех живых организмов
Гексокиназа. Википедия

Описание 3D-структур всех известных белков было бы невозможно без ИИ

Белки играют огромную роль в жизни клетки. Фактически именно белки и делают всю работу, которая обеспечивает жизнь всех организмов — от элементарных вирусов до человека. Определять последовательность аминокислот, из которых состоит белок, ученые имеют хорошо и быстро. Но узнать последовательность недостаточно. Белок начинает работать только после того, как он свернется в 3D-структуру. А вот определить эту структуру было очень сложно. Белов «превращали» в кристалл и использовали рентгеновскую кристаллографию. Это долго и дорого. Иногда ученые тратили на выяснение 3D-структуры одного белка месяцы и даже годы.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Но наступило будущее.

Вселенная белков

3D-структура белка в трех разных форматах
3D-структура белка в трех разных форматах
Википедия
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Все изменилось после того, как подразделение Google компания DeepMind разработала нейросеть AlphaFold, которая умеет по последовательности аминокислот предсказать 3D структуру белка. Нейросеть это делает быстро и качественно.

Исследователи использовали AlphaFold для предсказания структуры около 200 миллионов белков из 1 миллиона видов, охватывающих почти все известные белки на планете, пишет Nature.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Все 3D-структуры будут размещены в свободном доступе в базе данных, созданной DeepMind — разработчиком AlphaFold, и Европейским институтом биоинформатики (EMBL-EBI) Европейской лаборатории молекулярной биологии.

Перспективы, которые открываются перед биологами невероятные. Вместо тяжелого многодневного труда, чтобы получить 3D-структуру белка достаточно просто послать запрос.

Важно и то, что методы AlphaFold позволяют активно экспериментировать с искусственными белками. Теперь далеко не всегда нужно собирать реальный белок из аминокислот, например, чтобы проверить будет ли он работать. Достаточно отдать последовательность аминокислот AlphaFold, она построит 3D-структуру и скажет: «Что-то вы здесь накосячили». Это огромная экономия времени и денег. Таким образом можно найти действительно полезные белки.

Наступает новая эпоха по многих-многих областях биологии. Важнейшим приложением станет разработка новых лекарств.