ИИ ищет законы природы на основе известных теорий и новых данных. Так работают люди
В 1918 году американский химик Ирвинг Ленгмюр опубликовал работу, в которой изучал поведение молекул газа, прилипающих к твердой поверхности. Руководствуясь результатами тщательных экспериментов и своей теорией о том, что на поверхности твердых тел есть дискретные участки, которые заполняются молекулами газа, он разработал ряд уравнений, которые описывают, сколько газа прилипает к поверхности при разном давлении.
Примерно сто лет спустя, ИИ, разработанный, командой ученых под руководством IBM Research воспроизвел ключевую часть работы Ленгмюра, удостоенной Нобелевской премии по химии (1932). Кроме законов Ленгмюра ИИ нашел третий закон Кеплера, связывающий периоды обращения планет вокруг Солнца с их орбитами, и дал хорошее приближение релятивистского закона Эйнштейна о замедлении времени.
На рисунке модель, построенная AI-Descartes. Исходная теория состоит из законов для центробежной силы, гравитационной силы и условий равновесия. Опираясь на наблюдательные данные и исходную теорию, AI-Descartes строит зависимость периодов и орбит (серая поверхность). Синяя поверхность — наблюдаемые положения планет. Существенная ошибка допущена AI-Descartes при вычислении положения Венеры. Остальные планеты вычислены точно.
ИИ рассуждающий
Исследователи назвали систему AI-Descartes в честь Рене Декарта. Теперь ИИ будет работать вместе с AI Feynman и другими «искусственными учеными». В основе этих систем лежит концепция символической регрессией, которая находит уравнения, соответствующие исходным данным. ИИ-ученые создают от сотен до миллионов уравнений-кандидатов и отыскивают те, что наиболее точно описывают взаимосвязи данных.
AI-Descartes обладает рядом преимуществ по сравнению с другими системами, но его наиболее важным отличием «является способность логически рассуждать», как говорит Кристина Корнелио, ведущий автор работы. Если существует несколько уравнений-кандидатов, которые хорошо связывают данные, система выбирает то, которое лучше всего согласуются с базовой научной теорией. Способность рассуждать, опираясь на теорию, существенно отличает систему от программ «генеративного ИИ», таких как ChatGPT.
«В нашей работе мы объединяем подход, основанный на начальных принципах, который веками использовался учеными для выведения новых формул из существующих теорий, с подходом, основанным на данных, который более распространен в эпоху машинного обучения», — говорит Корнелио. — «Эта комбинация позволяет нам использовать преимущества обоих подходов и создавать более точные и значимые модели для широкого круга приложений».
Теория и эксперимент
AI-Descartes хорошо работает с зашумленными данными реального мира, которые ставят в тупик традиционные программы символьной регрессии. ИИ справляется и с небольшими наборами данных, находя надежные уравнения всего по десяти точкам.
Одним из факторов, который может замедлить внедрение такого инструмента, как AI-Descartes, является необходимость определения и кодирования соответствующей исходной теории.
«Нам нужно, чтобы эксперты-люди научились описывать законы в формальных, читаемых компьютером терминах. Это критически важно. Если человек допустил хоть одну ошибку, система не будет работать. Но люди ошибаются. В будущем, мы хотели бы автоматизировать эту часть работы. Тогда мы могли бы исследовать гораздо больше областей науки и техники», — пишут ученые.
Сначала машины научились вычислять формулы, потом — работать с массивами данных. Теперь они учатся получать формулы на основе данных. Так всегда делали люди