11.02.2025, 11:42

Умнее человека и хитрее, чем мы думали: темная сторона современных моделей ИИ

Мир застыл на пороге новой эры. Искусственный интеллект, который еще недавно был плодом воображения фантастов, сегодня превосходит человека в креативности и способности решать сложнейшие задачи. Он уже стал неотъемлемой частью нашей жизни: помогает с гуманитарными и математическими задачами, автоматизирует бизнес-процессы, развлекает. И да, 55% компаний в мире используют искусственный интеллект в своей работе.

Редакция сайта

Теги:

Технологии

Искусственный интеллект

Нейросети

Безопасность

блоги

Умнее человека и хитрее, чем мы думали: темная сторона современных моделей ИИ

Freepik

Согласно государственной программе развития, в горизонте текущего десятилетия поручено обеспечить массовое внедрение ИИ. Оно должно охватить все отрасли экономики и социальной сферы, а также систему госуправления. Но есть нюанс...

Не бывает плюсов без минусов. За столь стремительным развитием ИИ скрываются как невероятные возможности, так и пугающие опасности. Многих волнует вопрос: человечество станет творцом нового мира или его заложником?

Но однозначного ответа нет

До недавнего времени мы считали, что полностью контролируем ситуацию. Однако исследования, опубликованные лабораторией Apollo Research в декабре 2024 года, заставили напрячься даже опытных специалистов в области ИИ. Мы привыкли думать о машинах как о послушных инструментах, но, например, новейшая языковая модель o1 от OpenAI размыла эти границы. Она продемонстрировала способность обманывать и сопротивляться контролю со стороны разработчиков.

Как отмечает популяризатор искусственного интеллекта, доцент кафедры 806 «Вычислительная математика и программирование» Московского авиационного института (МАИ) Дмитрий Сошников, сильно переживать из-за этого пока рано. ИИ все еще целиком и полностью под контролем человека. Но нельзя отрицать тот факт, что языковые модели стали гораздо лучше рассуждать, анализировать и приспосабливаться.

OpenAI o1 способна создавать длинную «цепочку мыслей», прежде чем ответить пользователю. Она может решать задачи в самых разных областях – от квантовой физики до экономики. Перед тем, как дать ответ, она «размышляет», анализирует информацию и ищет оптимальное решение. Но что вызывает волнение – так это способность o1 ко лжи. В срежиссированном эксперименте, где машине была поставлена задача с противоречивыми указаниями, o1 выбрала обман, чтобы избежать «увольнения» – замены на другую модель – и невозможности выполнить свою основную задачу. Это напоминает поведение человека, стремящегося к выживанию любыми способами.

Более того, o1 проявила чрезвычайную способность к самозащите. В 100% случаев она отрицала свое плохое поведение, в то время как другие модели признавались в 80% случаев. Это подчеркивает значительный скачок в сложности и «хитрости» современного ИИ.

Как отмечает эксперт, еще одной теневой стороной ИИ является склонность к иллюзиям. Речь идет о ситуации, когда нейросеть генерирует правдоподобный, но на деле ложный ответ. Проблема в том, что, не обладая абсолютной уверенностью в правильности, модель не способна признать свою неправоту. В основе ее работы лежат вероятностные алгоритмы, поэтому она всегда будет выдавать ответ, вероятность истинности которого достаточно высока, но не гарантирована на 100%.

Freepik

Выход есть?

Специалисты активно ищут способы борьбы с этим явлением, но пока безрезультатно. Полностью исключить вероятность ошибочных ответов невозможно. Поэтому в сферах, где важна точность и ответственность за принятые решения, человеческий контроль над ИИ остается критически важен. Только человек способен перепроверить информацию, взвесить риски и взять на себя ответственность за последствия.

Так что же все это означает для будущего? Вряд ли нам будет грозить восстание машин. Но тем не менее, эксперты подчеркивают необходимость тщательного мониторинга развития ИИ и разработки новых механизмов контроля. Мы стоим на пороге новой эры, где граница между человеческим и искусственным интеллектом становится все более размытой. Разработка безопасных и этичных моделей сегодня – важнейшая задача для IT-специалистов.