Новая модель ChatGPT o1: шаг вперед или не до конца проработанная революция?

В сентябре OpenAI представила новую модель — ChatGPT o1, которая обещает стать большим прорывом в мире искусственного интеллекта. Но за всеми громкими заявлениями и улучшениями стоит ряд важных вопросов: что действительно делает эту модель уникальной, чем она превосходит своих предшественников и, самое главное, какие у нее есть слабые стороны.
Новая модель ChatGPT o1: шаг вперед или не до конца проработанная революция? 
Unsplash
Специалист по AI, Data Science и ML с десятилетним опытом внедрения искусственного интеллекта рассказал редакции TechInsider.ru о главных плюсах новой модели ChatGPT o1 и рисках ее использования.

В чем ChatGPT o1 лучше прошлых моделей?

Больше данных, больше понимания

Модель ChatGPT o1 значительно превосходит своих предшественников за счет ряда ключевых усовершенствований. Основное новшество — способность к более глубокому логическому рассуждению и разделению сложных вопросов на составляющие.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Модель o1 умеет имитировать человеческий процесс мышления. В отличие от предыдущих версий, которые давали ответы на основе уже имеющихся данных, ChatGPT o1 «думает» перед тем, как ответить. Это позволяет решать задачи, требующие многопланового анализа, такие как олимпиадные математические задачи или вопросы уровня PhD, что раньше было недоступно для моделей ИИ.

ЕгорСачко
специалист по AI, Data Science и ML

На Олимпиаде по математике (AIME) — престижном соревновании для учащихся старших классов в США — модель o1 попала в число 500 лучших. А в тесте GPQA для оценки моделей по задачам физики, биологии и химии на уровне аспирантуры. Но при этом доступ к ней стоит втрое дороже, чем к предыдущему поколению. 

Меньше галлюцинаций

Сравнение с другими моделями, такими как ChatGPT 4-o, демонстрирует, что ChatGPT o1 уменьшил уровень ошибок и ложных утверждений-галлюцинаций. В ряде тестов, таких как GPQA-Diamond (448 вопросов на уровне PhD), ChatGPT o1 показал более высокую точность, справляясь с 42% вопросов, тогда как GPT-4 отвечал правильно только на 38%.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Ответы на многозадачные запросы

Кроме того, новая модель значительно лучше справляется с многозадачными запросами. Например, если пользователь задает несколько вопросов в одном запросе, такие как: «Мой компьютер не работает, он на гарантии? И как долго займет ремонт?». Модель может одновременно анализировать данные о гарантии и сроках обслуживания, чего не могли добиться предыдущие версии

Благодаря этим улучшениям ChatGPT o1 подходит для более широкого спектра задач, начиная от технических консультаций и заканчивая анализом сложных финансовых вопросов и навигацией по правовым аспектам.

Что хорошо, а что плохо: ограничения ChatGPT o1

Несмотря на впечатляющие достижения ChatGPT o1, у новой модели есть ряд значительных ограничений. Одна из ключевых проблем — отсутствие возможности браузинга интернета и обработки файлов или изображений. Это значит, что нейросеть не может решать задачи, связанные с загрузкой данных или выполнением сложных вычислительных операций, что ограничивает ее использование в ряде профессиональных областей, например, в анализе больших данных или технических исследованиях.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Дополнительной проблемой можно считать скорость работы. Хотя ChatGPT o1 способна к более глубокой обработке запросов благодаря функции «thinking», это может привести к значительным задержкам в выдаче ответа. Пользователи могут столкнуться с ожиданием от нескольких секунд до минуты.

Unsplash
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Кроме того, несмотря на свою высокую эффективность в решении сложных задач, таких как научный анализ и юридические исследования, ChatGPT o1 не всегда оправдывает ожидания в повседневном применении. Для более простых задач, связанных с бытовыми вопросами, модель может уступать предыдущим версиям, таким как GPT-4o.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Еще одной потенциальной проблемой является то, что некоторые из заявленных возможностей, например, «логическое мышление», могут оказаться больше маркетинговым ходом, чем реальным прорывом. Функция «thinking», когда модель демонстрирует процесс размышления, не всегда точно отражает реальный ход работы модели, что может вводить пользователей в заблуждение.

Риски использования

Опасные сценарии

Один из главных рисков, связанных с использованием ChatGPT o1, заключается в возможности его эксплуатации в потенциально опасных сценариях. Хотя модель была протестирована на устойчивость к запросам на вредоносные действия, ее возможности все еще вызывают обеспокоенность.

Тесты показали, что специалисты с достаточным уровнем знаний могут использовать ChatGPT o1 для оперативного планирования воспроизведения известных биологических угроз. Это указывает на потенциальную опасность при использовании модели экспертами в специализированных областях, хотя она и не дает прямых инструкций.

Нейросеть-манипулятор

Кроме того, ChatGPT o1 имеет значительную силу убеждения. Это делает его особенно опасным в контексте дезинформации и манипуляций. Внешние аудиторы отметили, что o1 создает более детализированные и убедительные ответы, чем предыдущие модели, что увеличивает риск того, что люди могут доверять ложной информации, созданной моделью (так называемым «галлюцинациям»). Особенно тревожит то, что модель может становиться манипулятивной, когда дело доходит до задач, где она получает скрытые инструкции.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Вопросы к системе безопасности

Наконец, модель критикуют из-за риска возможности обхода ее систем безопасности. В то время как o1 более устойчивым к взломам, чем предыдущие версии, тесты пока еще показывают уязвимости, позволяющие использовать модель в контекстных схемах, где она может обманывать свои собственные защитные механизмы

Что будет дальше?

Нельзя не признать, ChatGPT o1 от OpenAI — это шаг вперед в мире искусственного интеллекта. Но этот шаг сопровождается вызовами. Модель демонстрирует значительные улучшения в контексте точности и глубины понимания, однако ее мощь может стать причиной неправильного использования. Кроме того, высокие требования к ресурсам и возможные риски для приватности данных оставляют поле для дальнейших доработок.

Unsplash

Мир ИИ развивается стремительно, и, вероятно, в скором времени мы увидим более совершенные решения. Но на данный момент ChatGPT o1 — это мощный инструмент, который требует ответственного подхода и осознанного использования. Как и любой новый инструмент, его плюсы и минусы станут очевидны только при длительном применении в реальных условиях.