ИИ-модель Centaur может имитировать поведение человека

Группа исследователей из нескольких ведущих университетов мира сообщает, что ей удалось создать новую вычислительную модель Centaur, которая может предсказывать и моделировать поведение человека с высокой степенью точности и в любой области. Модель обучалась на 10 миллионах решений, принятых 60 тысячами человек.
ИИ-модель Centaur может имитировать поведение человека
Unsplash
Centaur должен воспроизводить процесс принятия решений человеком в любой области деятельности. Модель обучали не решению конкретных задач, а самому процессу решения. Но насколько получилось «по-человечески», говорить пока рано. Предстоят еще долгие эксперименты.

Группа исследователей из ведущих университетов мира сообщает, что ей удалось создать новую вычислительную модель, которая может предсказывать и моделировать поведение человека с высокой степенью точности и в любой области.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Согласно препринту, размещенному на сервере psyarxiv, модель, получившая название Centaur, была обучена на наборе данных под названием Psych101. Это — база данных, содержащая большой объем информации о поведении человека.

Psych101 включает 160 психологических экспериментов с участием 60 092 человек, в которых люди сделали в общей сложности более 10 миллионов выборов. «Несмотря на то что ранее предпринимались попытки воплотить подобные теории путем построения вычислительных моделей, на данный момент у нас нет ни одной модели, которая бы полностью отражала человеческий разум», — пишут исследователи.

«Человеческий разум замечательно умеет решать самые разные задачи. Мы не только регулярно принимаем обыденные решения, например, выбираем хлопья для завтрака или наряд, но и выясняем, как вылечить рак или освоить космическое пространство», — пишут исследователи. — «В отличие от человека большинство современных вычислительных моделей — будь то машинное обучение или когнитивные модели — ориентированы на конкретную область. Они предназначены для решения одной конкретной задачи».

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Centaur

Обзор Psych-101 и Centaur. a. Psych-101 включает в себя пробные данные 160 психологических экспериментов и 60 092 участников, сделавших в общей сложности 10 681 650 выборов. В нем представлены такие области, как многорукие бандиты, принятие решений, память, контролируемое обучение, марковские процессы принятия решений и другие (приведенные примеры стилизованы и сокращены для удобства чтения). b. Centaur — это основа модели человеческого познания, полученная путем добавления адаптеров низкого ранга к современной языковой модели и ее доработки на Psych-101.
Обзор Psych-101 и Centaur. a. Psych-101 включает в себя пробные данные 160 психологических экспериментов и 60 092 участников, сделавших в общей сложности 10 681 650 выборов. В нем представлены такие области, как многорукие бандиты, принятие решений, память, контролируемое обучение, марковские процессы принятия решений и другие (приведенные примеры стилизованы и сокращены для удобства чтения). b. Centaur — это основа модели человеческого познания, полученная путем добавления адаптеров низкого ранга к современной языковой модели и ее доработки на Psych-101.
https://osf.io/preprints/psyarxiv/d6jeb

Соавтор работы Марсель Бинц сказал, что они доработали Centaur на основе большой языковой модели Llama 3.1 70B и обнаружили, что полученная модель «предсказывает поведение участников лучше, чем существующие когнитивные модели практически в каждом эксперименте».

Результаты теста Psych-101. a, Значения Pseudo-R2 для различных моделей в разных экспериментах. Значение, равное нулю, соответствует предсказанию на уровне случайности, в то время как значение, равное единице, соответствует идеальной предсказуемости ответов человека. Пропущенные столбики указывают на результаты ниже уровня случайности. Практически в каждом эксперименте Centaur превосходит как Llama, так и набор когнитивных моделей, специфичных для конкретной области. Обратите внимание, что мы включили только те эксперименты, для которых мы реализовали когнитивную модель, специфичную для данного домена, и объединили различные исследования, использующие одну и ту же парадигму. b, Моделирование на двухэтапной задаче. На графике показаны плотности вероятности вознаграждения и параметр, указывающий на то, как происходило обучение на основе модели для людей и симуляторов Centaur. c, Моделирование задачи о горизонте. График визуализирует плотности вероятности вознаграждения и параметр информационного бонуса для людей и симуляторов Centaur. d, Моделирование задачи грамматического суждения. На графике представлены плотности вероятностей для истинных и примерных оценок (т. е. количество правильных ответов из двадцати) для людей и симуляторов Centaur.
Результаты теста Psych-101. a, Значения Pseudo-R2 для различных моделей в разных экспериментах. Значение, равное нулю, соответствует предсказанию на уровне случайности, в то время как значение, равное единице, соответствует идеальной предсказуемости ответов человека. Пропущенные столбики указывают на результаты ниже уровня случайности. Практически в каждом эксперименте Centaur превосходит как Llama, так и набор когнитивных моделей, специфичных для конкретной области. Обратите внимание, что мы включили только те эксперименты, для которых мы реализовали когнитивную модель, специфичную для данного домена, и объединили различные исследования, использующие одну и ту же парадигму. b, Моделирование на двухэтапной задаче. На графике показаны плотности вероятности вознаграждения и параметр, указывающий на то, как происходило обучение на основе модели для людей и симуляторов Centaur. c, Моделирование задачи о горизонте. График визуализирует плотности вероятности вознаграждения и параметр информационного бонуса для людей и симуляторов Centaur. d, Моделирование задачи грамматического суждения. На графике представлены плотности вероятностей для истинных и примерных оценок (т. е. количество правильных ответов из двадцати) для людей и симуляторов Centaur.
https://osf.io/preprints/psyarxiv/d6jeb.
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Бинц говорит, что «внутренние представления» Centaur стали более соответствовать нейронной активности человека после тонкой настройки, хотя Centaur и не был специально обучен «улавливать нейронную активность человека».

Как пишут ученые, Centaur может работать в режиме реального времени, демонстрировать рациональное адаптивное поведение и учиться у окружающей среды. «Мы считаем, что Centaur — первый реальный кандидат на создание единой модели человеческого познания», — говорит Бинц.