Нейросети научились предсказывать поведение генов: борьба с раком
Проведенные исследования позволяют не только перевести клетку в состояние «старости» и болезни, но и изменить технические параметры генов и даже тип клетки. Это достижение позволит прежде всего значительно ускорить разработку новых методов ранней диагностики тяжелых полигенных заболеваний, например, рака, а также подобрать максимально эффективную терапию для лечения заболеваний с наследственной предрасположенностью.
Новый метод использует информацию об уровне активности генов, которую получают в результате одномолекулярного секвенирования РНК. Сегодня, на современном медицинском оборудовании, такие данные можно извлечь, например, из крови пациента. До сих пор технический шум не позволял исследователям во всем мире превратить большой объем экспериментальных данных, чья стоимость оценивается в миллиарды долларов, в новые методы диагностики заболеваний.
С помощью автокодировщика (другими словами - обученной нейросети) российские математики и биоинформатики впервые разложили сигнал на две составляющие: биологическую и техническую. Последняя компонента представляет собой технический шум, порожденный случайными факторами во время эксперимента.
«Объединив для совместного исследования экспериментальные данные из различных лабораторий, мы с помощью нашего инновационного метода сможем устранить в них не только технический шум, но и серийные эффекты. В перспективе можно собрать беспрецедентно большие датасеты, чтобы обучить компьютер распознавать и диагностировать разного рода заболевания на ранней стадии», – объяснил Николай Русских, специалист по машинному обучению.
Вместе с тем польза нового метода не ограничивается только ранней диагностикой – есть возможность регулировать и переключать в компьютере экспрессию генов между разными состояниями и типами клеток. Например, превратить экспрессию генов стромальных клеток беременной мыши в экспрессию генов кормящей. Более того, обученная нейросеть подтвердила свою эффективность в тестировании лекарственных препаратов. Так, действие вещества на одни типы клеток можно легко переносить на другие виды, что в большинстве случаев позволяет отказаться от дорогостоящих экспериментов.
«Это технологическое достижение позволило нам стать на шаг ближе к нашей основной цели – созданию эффективных методов ранней диагностики рака. Полученные результаты имеют фундаментальное значение для медицины, а также широкий спектр практического применения. Безусловно, очень многое еще предстоит сделать – мы продолжим работать над усовершенствованием метода, испытаем его на дополнительных наборах данных. Сейчас активно собираем базу из всех доступных в мире качественных датасетов, проводим гармонизацию этих данных и многое другое. Наша нейросеть будет непрерывно дообучаться на новых датасетах, чтобы в итоге "впитать" в себя полные знания о всех возможных паттернах поведения генов различных типов клеток в разных состояниях здоровья и болезни. Это открывает новые возможности для ранней диагностики и своевременного лечения полигенных заболеваний», – прокомментировал Евгений Терентьев, президент Благотворительного фонда исследования рака.
«Данная работа актуальна и представляет существенный научный интерес. Однако исследования выполнены in silico, т.е. опираются на компьютерную обработку уже доступных данных. Крайне важно запланировать проспективные исследования, которые позволят установить, насколько разработанные авторами алгоритмы подтверждаются в лабораторных экспериментах», – отметил Евгений Имянитов, член-корреспондент РАН, доктор медицинских наук, профессор, врач-генетик, руководитель отдела биологии опухолевого роста ФГБУ «НИИ онкологии им. Н.Н. Петрова».
Работа велась при содействии Благотворительного фонда исследования рака. Материал предоставлен пресс-службой Hi Tech.