Умнее человека и хитрее, чем мы думали: темная сторона современных моделей ИИ

Мир застыл на пороге новой эры. Искусственный интеллект, который еще недавно был плодом воображения фантастов, сегодня превосходит человека в креативности и способности решать сложнейшие задачи. Он уже стал неотъемлемой частью нашей жизни: помогает с гуманитарными и математическими задачами, автоматизирует бизнес-процессы, развлекает. И да, 55% компаний в мире используют искусственный интеллект в своей работе.
Умнее человека и хитрее, чем мы думали: темная сторона современных моделей ИИ
Freepik

Согласно государственной программе развития, в горизонте текущего десятилетия поручено обеспечить массовое внедрение ИИ. Оно должно охватить все отрасли экономики и социальной сферы, а также систему госуправления. Но есть нюанс...

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Не бывает плюсов без минусов. За столь стремительным развитием ИИ скрываются как невероятные возможности, так и пугающие опасности. Многих волнует вопрос: человечество станет творцом нового мира или его заложником?

Но однозначного ответа нет

До недавнего времени мы считали, что полностью контролируем ситуацию. Однако исследования, опубликованные лабораторией Apollo Research в декабре 2024 года, заставили напрячься даже опытных специалистов в области ИИ. Мы привыкли думать о машинах как о послушных инструментах, но, например, новейшая языковая модель o1 от OpenAI размыла эти границы. Она продемонстрировала способность обманывать и сопротивляться контролю со стороны разработчиков.

Как отмечает популяризатор искусственного интеллекта, доцент кафедры 806 «Вычислительная математика и программирование» Московского авиационного института (МАИ) Дмитрий Сошников, сильно переживать из-за этого пока рано. ИИ все еще целиком и полностью под контролем человека. Но нельзя отрицать тот факт, что языковые модели стали гораздо лучше рассуждать, анализировать и приспосабливаться.

ДмитрийСошников
доцент института № 8 «Компьютерные науки и прикладная математика» МАИ, кандидат физико-математических наук

OpenAI o1 способна создавать длинную «цепочку мыслей», прежде чем ответить пользователю. Она может решать задачи в самых разных областях – от квантовой физики до экономики. Перед тем, как дать ответ, она «размышляет», анализирует информацию и ищет оптимальное решение. Но что вызывает волнение – так это способность o1 ко лжи. В срежиссированном эксперименте, где машине была поставлена задача с противоречивыми указаниями, o1 выбрала обман, чтобы избежать «увольнения» – замены на другую модель – и невозможности выполнить свою основную задачу. Это напоминает поведение человека, стремящегося к выживанию любыми способами.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Более того, o1 проявила чрезвычайную способность к самозащите. В 100% случаев она отрицала свое плохое поведение, в то время как другие модели признавались в 80% случаев. Это подчеркивает значительный скачок в сложности и «хитрости» современного ИИ.

Как отмечает эксперт, еще одной теневой стороной ИИ является склонность к иллюзиям. Речь идет о ситуации, когда нейросеть генерирует правдоподобный, но на деле ложный ответ. Проблема в том, что, не обладая абсолютной уверенностью в правильности, модель не способна признать свою неправоту. В основе ее работы лежат вероятностные алгоритмы, поэтому она всегда будет выдавать ответ, вероятность истинности которого достаточно высока, но не гарантирована на 100%.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
грозит ли человечеству восстание машин
Freepik

Выход есть?

Специалисты активно ищут способы борьбы с этим явлением, но пока безрезультатно. Полностью исключить вероятность ошибочных ответов невозможно. Поэтому в сферах, где важна точность и ответственность за принятые решения, человеческий контроль над ИИ остается критически важен. Только человек способен перепроверить информацию, взвесить риски и взять на себя ответственность за последствия.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Так что же все это означает для будущего? Вряд ли нам будет грозить восстание машин. Но тем не менее, эксперты подчеркивают необходимость тщательного мониторинга развития ИИ и разработки новых механизмов контроля. Мы стоим на пороге новой эры, где граница между человеческим и искусственным интеллектом становится все более размытой. Разработка безопасных и этичных моделей сегодня – важнейшая задача для IT-специалистов.