OpenAi, трепещи! Китайский стартап DeepSeek представил инновационную модель ИИ

Представьте, что для строительства небоскреба вместо тысяч рабочих и тяжелой техники достаточно десяти человек с умными алгоритмами. Подобную революцию в мире искусственного интеллекта (ИИ) совершил китайский стартап DeepSeek, сократив стоимость обучения топовых моделей со 100 до 5 миллионов долларов. Означает ли это конец эры дорогих GPU и монополии гигантов вроде OpenAI? Объяснил Леонид Гольдберг.
OpenAi, трепещи! Китайский стартап DeepSeek представил инновационную модель ИИ
Freepik

Раньше ИИ был как завод, требующий отдельной электростанции, теперь это компактный гаджет. Об этом рассказал основатель Expert-Ai.ru Леонид Гольдберг в беседе с «ТехИнсайдером».

ЛеонидГольдберг
Основатель Expert-Ai.ru
Architector.tech

По словам специалиста, инновации DeepSeek напоминают переход от мейнфреймов к персональным компьютерам:

«Разработчики доказали, что для создания моделей уровня GPT-4 не нужны десятки тысяч серверных GPU. Их подход — это не оптимизация, а фундаментальный сдвиг в парадигме разработки ИИ»
Леонид Гольдберг основатель Expert-Ai.ru
Freepik
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Как DeepSeek перевернул правила игры

Традиционные модели используют 32-битные числа для расчетов, что гарантирует точность, но требует гигантских ресурсов. DeepSeek применил 8-битное квантование, сократив объем памяти на 75%.

«Это как заменить тяжелый грузовик спорткаром: вы теряете в грузоподъемности, но выигрываете в скорости и стоимости», — подчеркнул Гольдберг.

Кроме того, эксперт напомнил, что обычные модели обрабатывают текст последовательно, токен за токеном. DeepSeek, в свою очередь, анализирует целые фразы, ускоряя обработку данных в 2 раза с сохранением 90% точности. Для обучения на миллиардах слов это критично, объяснил он.

Результаты DeepSeek впечатляют:
Стоимость обучения 100 млн → 5 млн;
GPU: 100 000 → 2 000;
API: дешевле аналогов.

«Вместо гигантской модели, где задействованы все 1,8 триллиона параметров, DeepSeek использует модульную архитектуру: из общего пула в 671 миллиарда параметров активируются только 37 миллиардов, необходимых для конкретной задачи. Представьте больницу, где вместо 1000 врачей круглосуточно дежурят 50, но всегда именно те, кто нужен пациенту», — отметил специалист.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Совместимость с игровыми видеокартами вместо специализированных чипов

«[Производитель видеокарт] Nvidia построил империю на GPU с маржой 90%. Если DeepSeek докажет, что их подход масштабируем, это ударит по самой бизнес-модели — дорогое "железо" станет не нужно», — комментирует Гольдберг.

Однако эксперт также призвал к осторожности: «Пока DeepSeek демонстрирует успехи в специфических задачах, но не во всех. Их открытый код и документы — это прорыв для сообщества, однако гиганты вроде OpenAI уже работают над аналогичными методами».

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
Freepik
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

ИИ будущего: децентрализация и доступность

Специалист Гольдберг выделил три ключевых последствия внедрения технологии:

  • Смерть «культуры гипермасштабирования»: небольшие команды смогут конкурировать с корпорациями.
  • Рост Open Source: публичность кода DeepSeek ускорит развитие отрасли.
  • Смена приоритетов: вместо покупки GPU будут инвестиции в алгоритмическую эффективность.

«Это напоминает 2006 год, когда Amazon выпустила AWS. Технологии ИИ станут доступны даже стартапам с ограниченным бюджетом. Но говорить о крахе Nvidia преждевременно — их чипы еще долго будут востребованы для задач, где важна максимальная производительность», — рассказал он.

Коротко: что это значит для нас?

  • Для разработчиков: Порог входа в ИИ снижается. Теперь стартап из 10 человек может создать прототип, который раньше требовал команды в 500+ инженеров.
  • Для бизнеса: Стоимость AI-решений упадет, но конкуренция взлетит. Как с облачными сервисами в 2010-х: выиграют те, кто предложит уникальные сценарии использования.
  • Для Nvidia: Риски есть, но паника преждевременна. Даже если спрос на серверные GPU сократится, рынок игровых и специализированных чипов (например, для робототехники) останется за ними.

«Главный урок DeepSeek в том, что ИИ — это не гонка железа, а марафон идей. Алгоритмическая элегантность победит грубую силу вычислений. Но, как в случае с ChatGPT, баланс сохранится: гиганты останутся для экзафлопсных задач, а оптимизированные модели займут ниши, где важны скорость и доступность», — заключил основатель Expert-Ai.ru.