Научный инсайд: организаторы и лауреаты Научной премии Сбера — о перспективах развития отечественной науки

Научная премия Сбера — крупнейшая частная премия в России, которая ежегодно поддерживает молодых исследователей, совершивших фундаментальные открытия, и вносит существенный вклад в развитие отечественной науки.
Редакция сайта
Редакция сайта
Научный инсайд: организаторы и лауреаты Научной премии Сбера — о перспективах развития отечественной науки
Freepik / Midjourney 5.2
Можно ли назвать проект драйвером прорывных идей, какие номинации утверждены в рамках премии, как ученые становятся лауреатами, в чем миссия искусственного интеллекта в науке и что делает бизнес для того, чтобы открытия в лучшую сторону меняли наш привычный мир? Все эти вопросы редакция Techinsider.ru обсудила с учеными и организаторами премии.
АндрейБелевцев
старший вице-президент, руководитель блока «Технологическое развитие» Сбербанка

Наша Нобелевка: чем выделяется Научная премия Сбера

Почему частные научные премии в России стали возникать только в последние несколько лет?

А.Б.: За всю Россию не скажу, но скажу про Сбер. Мы стремимся создавать как можно больше поводов гордиться своей страной в целом и ее наукой в частности. Но для начала люди должны узнать, чем живет наука. В науке очень важно ее будущее, а не только ее настоящее. А будущее науки – это молодые ребята. Поэтому наука должна быть модной.

Научная премия Сбера позиционируется как драйвер прорывных идей. Чем она отличается от других научных наград в России?

А.Б.: Нам важно создавать сообщество победителей премии, чтобы своими действиями они друг друга подпитывали и помогали распространять лучшие научные практики. Мы стараемся организовывать для них и с ними мероприятия, популяризировать их работы, давать молодежи ориентиры. Важно, что в премии нет никакого нашего влияния на выбор победителя. Для отбора номинантов, их обсуждения и голосования сформированы очень широкие и уважаемые ученые и экспертные советы.

Лауреат Научной премии Сбера 2024: Евгений Бурнаев, доктор физико-математических наук, профессор, директор Центра искусственного интеллекта Сколтеха, руководитель научной группы Обучаемый интеллект Института AIRI
widget-interest

Номинация: Цифровая вселенная

 

Присуждена: за фундаментальные результаты в области теоретических основ и технологий ИИ для решения крупномасштабных задач инженерии, медицины и устойчивого развития, основанные на разработанных методах и алгоритмах глубокого обучения, генеративного модели рования и стохастического анализа многомерных неструктурированных данных со сложной внутренней геометрической структурой

 

Команда исследователей из Центра искусственного интеллекта Сколковского института науки и технологий под руководством доктора физико-математических наук, профессора Евгения Бурнаева разработала методологию Инженерного искусственного интеллекта и реализующий ее программный инструментарий. Технологии, созданные учеными, могут применяться для решения задач инженерии, медицины и устойчивого развития. 

Почему вы решили учредить новую номинацию для молодых исследователей — «AI в науке»?

А.Б.: C 2022 года Сбер вручает три ежегодных персональных премии по 20 млн руб. в номинациях «Физический мир», «Науки о жизни» и «Цифровая вселенная» для ученых, которые внесли значительный вклад в развитие науки. С 2024 года учреждена новая номинация «AI в науке». Три командных премии молодым исследователям за достижение выдающихся научных результатов в трех основных номинациях, полученных с применением AI-технологий. Размер каждой награды составляет 4,5 млн руб. и 1 млн руб. на облачные вычисления.

Мы назвали новую номинацию премии «AI в науке», потому что в науке сейчас все основные прорывы будут связаны с искусственным интеллектом. Он меняет природу эксперимента и исследования, повышает эффективность анализа данных, постановки экспериментов, проверки гипотез. Большинство ученых, с которыми мы общаемся, в этом смысле передовики. Практически все они так или иначе используют генеративные модели.

Человечество в последнее время вынуждено идти по пути глубокой специализации. Если раньше были светила, такие как Михаил Ломоносов или Леонардо да Винчи, которые с феноменальным успехом работали в совершенно разных отраслях, то сейчас ученым приходится работать в очень узких нишах, чтобы добиться успеха. У AI-моделей этих ограничений нет. Возьмем нашу фундаментальную модель GigaChat. Она одновременно сдает экзамены по экономике, медицине. Да, есть кардиологи, экономисты и программисты лучше, чем наша модель. Но чтобы один человек мог обладать качественными знаниями высокого уровня в разных областях? Я затрудняюсь назвать такого.

Лауреат Научной премии Сбера 2024: Сергей Лукьянов, академик РАН, доктор биологических наук, ректор РНИМУ им. Н.И. Пирогова
widget-interest

Номинация: Науки о жизни 

 

Присуждена: за открытие и применение природных флуоресцентных белков для технологий прижизненной визуализации и для исследований молекулярных и клеточных процессов в живых организмах, а также за разработку принципиально новой стратегии лечения тяжелых аутоиммунных заболеваний

 

В первозданном состоянии белки большинства существ на Зем ле прозрачны, что затрудняет наблюдение за ними. Решить эту проблему помог биоимиджинг: использование флуоресцентных белков и биосенсоров. Он получил широкое распространение после того, как команда академика РАН, доктора биологических наук, ректора РНИМУ им. Н.И. Пирогова Сергея Лукьянова выяснила, что цветовое разнообразие флуоресцирующих коралловых полипов связано с белками различных цветов, причем за цвет и свечение отвечает один и тот же ген. В итоге были созданы десятки генетически кодируемых флуоресцентных меток разных цветов для прижизненного мониторинга изменения параметров клетки. Сейчас биоимиджинг широко применяют для определения ключевых таргетов при создании лекарственных препаратов и визуализации их действия в живых системах. Это позволяет существенно ускорить исследования.

Как научные инициативы вписываются в бизнес-стратегию Сбера?

А.Б.: Сбер намного шире, чем финансовый институт. Мы работаем для людей, но при этом понимаем, что развитие фундаментальной науки соответствует долгосрочным интересам наших клиентов и страны в целом. То, что сегодня фундаментальная наука, завтра становится технологическим будущим. Если ты хочешь, чтобы завтра было лучше, чем сегодня, надо в эту науку вкладываться.

«Нужно ответить на вопрос: почему выпускнику университета стоит связать свою карьерную траекторию с наукой? Что именно дают России и миру ученые? И различные премии, в том числе Научная премия Сбера, — это по пытка подсветить то, что у нас происходит, обозначить и опытных ученых, и молодежь»
Андрей Белевцев старший вице президент, руководитель блока «Технологическое развитие» Сбербанка
Как оцениваются научные проекты номинантов?

А.Б.: Жюри смотрит на то, как фундаментальное открытие влияет на реальный мир. Здесь я вижу прямую аналогию с Нобелевской премией. Ее чаще всего дают через какое-то количество лет после того или иного открытия – когда становится понятно, что это действительно фундаментальное открытие, которое меняет очень многое в жизни людей и имеет большое прикладное значение. Этот стык обязателен. Главная цель Сбера заключается не в финансировании фундаментальной науки, а в том, чтобы рассказывать, какие области исследований в принципе нужны, важны и интересны.

Лауреат Научной премии Сбера 2024: Евгений Антипов, член-корреспондент РАН, доктор химических наук, заведующий кафедрой электрохимии химического факультета МГУ им. М.В. Ломоносова
widget-interest

Номинация: Физический мир 

 

Присуждена: за создание высокотемпературных сверхпроводников и новых материалов для металл-ионных аккумуляторов, открывающих перспективы повышения энергетической безопасности и перехода к климатической нейтральности

 

Использование сверхпроводников всегда было ограниченным: раньше их охлаждали жидким гелием, температура которого составляет около –269 °С. Однако появление высокотемпературных сверхпроводников позволило использовать намного более дешевый хладагент – жидкий азот с температурой кипения –196 °С. Существенный вклад в развитие этой области внесли член-корреспондент РАН, доктор химических наук, заведующий кафедрой электрохимии химического факультета МГУ им. М. В. Ломоносова Евгений Антипов и его коллеги, открывшие семейство сверхпроводников с рекордной температурой перехода в сверхпроводящее состояние (при нормальном давлении). Кроме того, ученый работал над созданием нового поколения металл-ионных аккумуляторов – в частности, натрий-ионных. Также он изобрел альтернативную технологию получения алюминия, при исполь зовании которой выделяется кислород, а не углекислый газ.

«AI в науке»: как искусственный интеллект помогает совершать открытия

В науке наступает эпоха, когда большое количество научных открытий будет сделано с помощью ИИ. И это уникальный шанс для молодых ученых обогнать «зубров» науки. Трое лауреатов номинации «AI в науке» Научной премии Сбера 2024 года рассказали, как ИИ помогал им в исследованиях.

Лауреаты Научной премии Сбера
Редакция Techinsider.ru
Александр Коротин
  • Номинация: «AI в науке. Цифровая Вселенная»
  • За разработку цикла алгоритмов генеративного искусственного интеллекта на основе оптимального транспорта для моделирования многомерных данных, цифровой обработки и синтеза изображений.

А.К.: Я занимаюсь генеративным ИИ, который, как видно из названия, может применяться для генерации цифрового контента – изображения, музыка, тексты, видео и еще много где, просто он не везде еще добрался. Моя область интересов – преимущественно изображения. Одна из суперзадач на сегодняшний день – сверхразрешение. Это очень важная функция – она используется, например, в астрономии и при обработке спутниковых или медицинских снимков.

АлександрКоротин
кандидат физико-математических наук, руководитель исследовательской группы по генеративному искусственному интеллекту в Центре искусственного интеллекта Сколтеха, старший научный сотрудник Института AIRI
Сверхразрешение – это когда на вход подается изображение в низком качестве и разрешении, возможно, с какими-то помехами и артефактами, а на выходе надо получить такую же картинку, только в большем разрешении, с улучшенными деталями и устраненными артефактами.

Самое распространенное применение сверхразрешения – цифровой зум в мобильных телефонах. Родоначальником теории «оптимального транспорта» считается французский математик Гаспар Монж, который в конце XVIII века задавался вопросом: есть одна гора песка, надо ее перета щить в другое место – как наиболее эффективно это сделать? Через полтора столетия уже советский математик и экономист Леонид Канторович активно занялся исследованием этой математической задачи, но уже в контексте оптимального распределения ресурсов. Например, как эффективно перевозить грузы между заводами, чтобы затраты были наименьшие. Поэтому эти задачи и стали называть транспортными.

Собственно, нашей команде удалось применить эту математическую теорию к задачам цифровой обработки изображений. Мы разработали серию алгоритмов, я их называю «нейросетевой оптимальный транспорт», и с их помощью мы осуществляем преобразования, транспортировку одних изображений в другие изображения. Например, изображения в низком качестве в изображения высокого качества. У нас в Сколтехе в Центре искусственного интеллекта последние три года по заказу Сбера разрабатывалась большая платформа для анализа климатических рисков на территории России.

ИИ предсказывает климат
Freepik / Midjourney 5.2

Там много сценариев, которые эта платформа может обрабатывать, например: прогнозировать лесные пожары, засухи, проводить оценку ущерба от наводнений. И я там непосредственно занимался разработ кой одного из модулей, который связан как раз со сверхразрешением климатических прогнозов. Прогнозы, которые делаются физической моделью, не детальные, там разрешение 1,5 на 2 градуса широты и долготы, а нам с помощью наших алгоритмов удалось повысить детальность прогноза в 48 раз до точности 0,25 на 0,25 градуса.

Мы выпустили научную статью, как эффективно ускорять алгоритмы сверх разрешения, и ту модель, которую мы там описывали, выложили в открытый доступ. Мы занимаемся академической наукой, поэтому там нет сервиса, в который можно загрузить изображение и на выходе получить картинку высокого разрешения. Но другие исследователи или стартапы могут довести наши алгоритмы до какого-нибудь коммерческого образца.

ДЕТАЛЬНЫЙ ПРОГНОЗ

Наш алгоритм сверхразрешения изображений на основе оптимального транспорта повышает детализацию метеокарт, полученных из физического симулятора, для их дальнейшего анализа.

Чем мы руководствовались, выкладывая алгоритмы в открытый доступ? Это общий тренд в области искусственного интеллекта, почти все научные разработки делаются в том или ином виде публично доступными. И благодаря этому ИИ развивается так быстро. Все технологические компании, работающие в этой сфере, прекрасно понимают, что технологиями, по крайней мере, какими-то общими, базовыми вещами, нужно делиться, и эта синергия позволяет быстро развиваться.

Марк Иванов
  • Номинация: «AI в науке. Науки о жизни»
  • За применение методов машинного обучения в протеомных исследованиях для идентификации белков и извлечения биологически значимой информации в биомедицинских задачах.

М.И.: Протеомика – область молекулярной биологии, посвященная идентификации и количественному анализу белков. Она состоит из так называемой мокрой экспериментальной части, где проводится извлечение белков из образцов, там же эти белки разрезаются с помощью ферментов на пептиды, более маленькие части белков, и эти пептиды уже непосредственно анализируются при помощи хроматографии и масс-спектрометрии. После чего начинается анализ данных – нужно понять, что там были за пептиды нарезаны, из этих пептидов восстановить белки, из которых они нарезались, и понять примерную концентрацию этих белков.

МаркИванов
кандидат физико-математических наук, ведущий научный сотрудник Института энергетических проблем химической физики им. В.Л. Тальрозе ФИЦ ХФ РАН

Мы применяем машинное обучение для задач идентификации пептидов и белков, а также для анализа уже финальных получаемых данных. В первой я использую модели на основе градиентного бустинга, так как тут требуется для каждого эксперимента обучать свою собственную модель на лету и на относительно небольших выборках, поэтому модель применяется единожды и забывается, что связано с большими различиями между экспериментальными данными. В другом наборе данных свойства пептидов могут быть немного другие и эта модель работать не будет. Для последней стадии, а именно при анализе количественных различий в белках, мы применяем одно из самых простых решений машинного обучения – модели на основе деревьев решений, так как нужна максимальная интерпретируемость и минимальное переобучение модели.

Финальная стадия анализа — связать концентрации белков, которые мы измерили и получили, с биологической или медицинской задачей. Например, в случае определенной болезни одни белки повышены, другие – понижены.
Медицина будущего
Freepik / Midjourney 5.2

Если перейти к нашим уникальным разработкам в области протеомики и сравнить их с классическими подходами, то сразу стоит уточнить, что там тоже уже давно применяется машинное обучение в различных стадиях анализа, и наш вклад не в том, что мы додумались это сделать. Мы предложили свою концепцию, как нужно проводить эксперимент, чтобы сократить на порядок время на масс спектрометрическую часть анализа. Масс-спектрометр у нас снимает намного меньше информации, но он это делает в 10 раз быстрее, чем при классическом подходе. Почему это важно? Масс-спектрометр высокого разрешения – основной инструмент в протеомике и самая дорогая часть исследования, они труднодоступны и очень дорогие.

Однако, пожертвовав частью экспериментальных данных, нам пришлось придумать алгоритмы анализа данных, которые компенсировали экспериментальные потери. Сначала это все было реализовано без использования машинного обучения и мы показали принципиальную возможность такого подхода, но эффективность анализа сильно проигрывала существующим альтернативам. И лишь когда мы применили технологии ИИ в нашем подходе, метод стал конкурентен и действительно интересен.

БЫСТРО И ЭКОНОМНО

Метод позволяет сократить в 10 раз и время, и стоимость эксперимента.

В стандартном эксперименте на один образец затрачивается примерно час работы масс-спектрометра. Если это большое исследование, где надо, например, 200 образцов проанализировать, то это 200 часов, около 10 дней. А стандартный часовой анализ на масс-спектрометре стоит примерно 10 тыс. рублей, и 200 образцов обой дутся в 2 млн рублей, на что уйдет большая часть гранта.

Александр Квашнин
  • Номинация: «AI в науке. Физический мир»
  • За применение искусственного интеллекта, включая нейросетевые и регрессионные модели, для предсказаний и исследований свойств новых функциональных и конструкционных материалов, таких как высокотемпературные сверхпроводники, сверхтвердые материалы и некристаллические структуры.

А.К.: Долгое время в науке считалось, что предсказание свойств новых материалов – нерешаемая задача. Сначала химики получали новое вещество и потом изучали его свойства, может, для чего-нибудь оно пригодится. Значительный прорыв в этой области совершил наш соотечественник Артем Оганов, разработавший со своими учениками метод USPEX для предсказания кристаллических структур, который до сих пор является одним из лидеров в своей области.

АлександрКвашнин
доктор физико-математических наук, профессор и руководитель научной группы промышленно- ориентированного поиска материалов Сколтеха

Ну, а мы в своей лаборатории за нимались сверхпроводимостью при высоких давлениях, искали высокотемпературные сверхпроводники. В 2014 году впервые при помощи компьютерного моделирования методом USPEX предсказали материал, который будет сверхпроводником при температуре 203 Кельвина – гидрид серы. Это была чисто теоретическая работа.

Но спустя год на основе этих данных провели синтез этого соединения и получили точь-в-точь то, что и предсказывали. Все сразу поняли, что метод работает, и бросились в это направление: «Давайте считать, это дешевле, чем эксперименты!». У кого были вычислительные мощности, стали в системе «металл – водород» заменять металл на другие металлы, предсказывать новые свойства новых материалов и писать статьи.

В таблице Менделеева куча элементов, мы можем все перебирать, на каждую систему писать статью. Где тут новизна, неинтересно. И мы решили все это обобщить, собрать все экспериментальные и теоретические данные по гидридной сверхпроводимости, и с коллегами написали несложную нейросеть слоев в десять. На вход подаем базовые и фундаментальные характеристики металлов в гидридах, а на выходе получаем температуру сверхпроводимости, которая должна быть в этой системе. И за один расчет нарисовали всю таблицу Менделеева с указанием, где и какой максимум мы можем получить. Например, в области платины и палладия предсказан почти ноль, и там не надо делать эксперименты, тратить деньги и время. А вот сбоку, где сложные элементы, такие как лантан, иттрий, барий, стронций, там стоит поискать, потому что предсказанная критическая температура высокая. И эксперименты подтвердили наши предсказания.

Мы можем теперь рассчитывать намного большие системы, и притом точность будет очень высокая. Это дает возможность прогнозировать свойства не кристаллических соединений — композитных материалов, поликристаллических материалов, — которые максимально приближены реальности.
ИИ в квантовой химии
Freepik / Midjourney 5.2
ИИ + КВАНТОВАЯ ХИМИЯ

Машинное обучение позволяет параметризировать потенциал, который уже не имеет вид формулы, и при этом подбираются тысячи параметров. 

Другое наше направление – изучение свойств материалов посредством машинно обучаемых потенциалов. Раньше было два основных подхода. Первый – квантовая химия, при помощи которой можем очень точно решать, находить энергию материалов и считать свойства. Есть тут свои ограничения – мы можем считать только идеальные кристаллы. Второй метод – молекулярная механика или динамика. Условно это уравнение Ньютона: атомы у нас шарики, задаем взаимодействие между ними и считаем. Проблема заключалась именно в описании взаимодействия между атомами. Существуют эмпирические модели, эмпирические потенциалы, описывающие взаимо действия, их много, но если мы хотим изучить новый материал, то такой модели может и не быть.

И вот здесь как раз пришли на помощь методы машинного обучения, которые позволяют на данных квантовой химии параметризовать некий потенциал, который уже не имеет вид формулы, при этом подбираются тысячи параметров. Эти методы позволяют получать потенциалы, очень точно описывающие межатомные взаимодействия, почти на уровне квантовой химии, но при этом расчеты проводятся в тысячи раз быстрее.

Мы занимаемся моделированием, нам нужны суперкомпьютеры и в этом смысле один миллион рублей на облачные вычисления – очень хорошо. Потратить миллион рублей на вычислительные ресурсы – не проблема. Проблема – потратить с умом.