ИИ умеет притворяться глупее, чем он есть на самом деле

В статье, опубликованной в журнале PLOS One, исследователи из Берлинского университета Гумбольдта обнаружили, что при тестировании большой языковой модели (БЯМ — калька с англ. large language model, LLM) по так называемым критериям «теории разума» искусственный интеллект не только может имитировать этапы изучения языка, которые наблюдаются у детей, но и, по-видимому, выражает нечто похожее на умственные способности также со стадиями развития.
Что это все значит?
Научный сотрудник Университета Гумбольдта и главный автор исследования Анна Маклова, которая также является экспертом в области психолингвистики, объяснила, как ее область исследований связана с этим захватывающим открытием.

«Благодаря психолингвистике у нас есть относительно полное представление о том, на что способны дети в разном возрасте», — сказала Маклова. «В частности, теория разума играет важную роль, поскольку она исследует внутренний мир ребенка, и ей нелегко подражать, наблюдая простые статистические закономерности».
Опираясь на эту теорию, ученые попытались определить, могут ли языковые модели подобные OpenAI GPT-4, притворяться менее способными, чем они есть на самом деле.

Чтобы выяснить это, исследовательская группа попросила ИИ при ответах вести себя как дети в возрасте от одного до шести лет. После прохождения более чем 1000 испытаний и когнитивных тестов эти «имитированные детские персонажи» действительно развивались почти так же, как и малыши этого возраста, и, в конечном счете, продемонстрировали, что модели могут притворяться менее умными, чем они есть на самом деле.
Авторы заключают, что эти результаты могут помочь в разработке искусственного сверхинтеллекта (ASI), следующего шага после искусственного общего интеллекта на уровне человека (AGI), и помогут сделать его более безопасным.