ИИ генерирует изображения по тексту на обычном компьютере
Создавать изображения по текстовому описанию за считанные секунды с помощью обычной видеокарты и без суперкомпьютеров теперь возможно благодаря новой модели Stable Diffusion AI. Лежащий в основе алгоритм был разработан группой машинного зрения и обучения исследователями Университета Людвига-Максимилиана, Мюнхен.
«Даже для непрофессионалов, не наделенных художественным талантом и не имеющих специальных вычислительных ноу-хау и компьютерного оборудования, новая модель является эффективным инструментом, позволяющим компьютерам генерировать изображения по команде», — говорит ведущий разработчик Бьорн Оммер. Но и опытные художники могут использовать Stable Diffusion для быстрой реализации новых идей в графических набросках.
Исследователи убеждены, что такие инструменты на основе ИИ смогут расширить возможности творческого создания изображений, для которых мы привыкли использовать Photoshop. Ученые убеждены, что такие инструменты, как Stable Diffusion AI, способны изменить искусство рисунка также, как компьютерная обработка текста изменила письмо с помощью ручки или пишущей машинке.
Квинтэссенция миллиарда образов
В своем проекте ученые пользовались поддержкой стартапа Stability.Ai, на серверах которого обучалась модель ИИ. «Эта дополнительная вычислительная мощность и дополнительные обучающие примеры превратили нашу модель ИИ в один из самых мощных алгоритмов синтеза изображений», — говорит Бьорн Оммер.
Особенностью подхода является то, что при всей мощности обучаемой модели она настолько компактна, что работает на обычной видеокарте и не требует суперкомпьютера. С этой целью искусственный интеллект преобразует миллиарды обучающих изображений в модель ИИ размером всего в несколько гигабайт.
«Как только такой ИИ действительно поймет, что представляет собой автомобиль или какие характеристики типичны для художественного стиля пользователя, он уловит эти существенные черты и в идеале должен быть в состоянии создавать новые образцы так же, как ученики мастера могут создавать работать в его стиле», — объясняет Оммер.
Модель Stable Diffusion была выпущена бесплатно под лицензией CreativeML Open RAIL-M, чтобы облегчить дальнейшие исследования и более широкое применение этой технологии.
Пришло время почувствовать себя художником