Stable Diffusion научилась генерировать пальцы — у людей на картинках их теперь пять!

Будущие изображения нейросетей станут более реалистичными благодаря новой версии Stable Diffusion, в которой отдельное внимание уделено проблеме изображения пальцев и кистей.
Никита Шевцев
Никита Шевцев
Stable Diffusion научилась генерировать пальцы — у людей на картинках их теперь пять!
Нейросеть

Согласно недавнему отчету Bloomberg, компания Stability AI, которая разрабатывает генератор изображений Stable Diffusion AI, планирует выпустить новую модель SDXL 0.9, которая расширит возможности Stable Diffusion.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Пальцы на картинах нейросетей

В четверг Stability AI опубликовал сообщение в блоге, которое затем было удалено, с подробным описанием спецификаций и деталей запуска модели SDXL 0.9. Список был достаточно большим, поэтому не понятно, что именно Stability AI планирует обновить в первую очередь.

Как следует из публикации, новая модель является преемницей версии Stable Diffusion XL, которая была выпущена в апреле, и будет направлена на улучшение генерации рук и общей «детализации изображения и композиции», сообщает Bloomberg.

В сообщении в блоге приведены примеры изображений, сгенерированных на основе тех же подсказок, чтобы продемонстрировать улучшение качества по сравнению с бета-версией Stable Diffusion XL и SDXL 0.9.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
Stability AI

При этом разработчики заявляют, что новая модель представляет собой «скачок в творческих вариантах использования для создания изображений искусственного интеллекта». Некоторые подсказки включают инопланетян, волка и человека, держащего кофейную чашку.

Предстоящее обновление SDXL 0.9 следует за выпуском Midjourney v5 в марте, которая также была направлена на улучшение генерации рук. Midjourney AI разрабатывает свои собственные запатентованные модели и сталкивается с аналогичной проблемой — в более ранних моделях руки людей часто генерировались с неправильным количеством пальцев — от четырех до 7-10.