ИИ становится настоящим ученым, если к обучающим данным добавить теорию, созданную человеком
Исследователи под руководством Пекинского университета разработали структуру для оценки относительной ценности правил и данных в «информированных моделях машинного обучения», которые включают в себя и то, и другое. Ученые показали, что таким образом они могут помочь ИИ учесть основные законы реального мира и лучше ориентироваться в научных проблемах, таких как решение сложных математических задач и оптимизация экспериментальных условий в химических экспериментах.
«Внедрение человеческих знаний в модели ИИ потенциально может повысить их эффективность и способность делать выводы, но вопрос в том, как сбалансировать влияние данных и знаний», — говорит первый автор Хао Сюй из Пекинского университета. «Наша структура может быть использована для оценки различных знаний и правил для повышения прогностических возможностей моделей глубокого обучения».
Генеративные модели искусственного интеллекта, такие как ChatGPT или Sora, основаны исключительно на данных: моделям предоставляются обучающие данные, и они обучаются методом проб и ошибок. Однако, получая только данные, эти системы не имеют возможности изучать физические законы, такие как гравитация или гидродинамика, и им также трудно работать в ситуациях, которые отличаются от их обучающих данных.
Как посадить ИИ за учебники
Альтернативный подход — это информированное машинное обучение, при котором исследователи предоставляют модели некоторые базовые правила, помогающие управлять процессом обучения, но пока не вполне понятно как сделать.
«Мы пытаемся научить модели ИИ законам физики, чтобы они могли лучше отражать реальный мир, что сделало бы их более полезными в науке и технике», — говорит соавтор работы Юньтянь Чен из Восточного технологического института в Нинбо.
Чтобы повысить производительность информированного машинного обучения, команда разработала структуру для расчета вклада отдельного правила в точность прогнозирования данной модели. Исследователи также изучили взаимодействие между различными правилами, поскольку большинство информированных моделей машинного обучения включают в себя несколько правил, а слишком большое количество правил может привести к сбою моделей.
Это позволило ученым оптимизировать модели, регулируя относительное влияние различных правил и полностью отфильтровывать избыточные или противоречивые правила.
«Мы обнаружили, что правила имеют разные типы взаимосвязей, и мы используем эти взаимосвязи, чтобы ускорить обучение модели и повысить точность», — говорит Чен.
Исследователи говорят, что их структура имеет широкое практическое применение в инженерии, физике и химии. Они продемонстрировали потенциал метода, используя его для оптимизации моделей машинного обучения при решении многомерных уравнений и прогнозировании результатов экспериментов по тонкослойной хроматографии и оптимизации будущих условий экспериментальной химии.
Исследователи планируют превратить свою структуру в загружаемый плагин, который смогут использовать другие разработчики ИИ. В конечном счете, ученые хотят обучить свои модели так, чтобы они могли извлекать необходимые им знания и правила непосредственно из данных, а не только использовать правила, выбранные исследователями-людьми.
«Мы хотим сделать это замкнутым циклом, превратив модель в настоящего ученого», — говорит Чен. — «Мы работаем над разработкой модели, которая сможет напрямую извлекать знания из данных, а затем использовать эти знания для создания правил и самосовершенствования».