12.04.2022, 09:18

OpenAI доработала свою нейросеть: теперь она умеет делать более качественные изображения по текстовому описанию

В январе 2021 года лаборатория искусственного интеллекта OpenAI создала DALL-E, нейросеть, которая генерирует мультяшные изображения из текстовых подписей. Теперь компания усовершенствовала программу – она научилась делать более качественные и детальные изображения.

Виталий Маршак

Пишу новости, составляю тесты

Теги:

Нейросети

Изобразительное искусство

OpenAI

Некоторые изображения по-настоящему удивляют

DALL-E 2 – обновленная нейросеть от OpenAI, которая умеет генерировать более детальные картинки по текстовому описанию.

К примеру, описание «космонавт», «верхом на лошади» и «в фотореалистичном стиле» привело к генерации такого изображение:

OpenAI

Самое поразительное в том, что обновленная нейросеть самостоятельно понимает, как и в какой позе посадить космонавта на лошадь и знает, что такое фотореализм.

Согласно сайту OpenAI, нейросеть умеет не только генерировать изображения, но и редактировать их. По запросу она может изменить некоторые детали фото, добавив или убрав конкретные элементы.

А это миска-монстр из пряжи, которую также создала DALL·E 2:

Как работает DALL-E?

Согласно описанию, «DALL·E 2 изучила взаимосвязь между изображениями и текстом, используемым для их описания. Она использует процесс, называемый "рассеиванием", который начинается с узора из случайных точек и постепенно изменяет этот узор в сторону изображения, когда нейросеть распознает определенные аспекты этого образа».

Пока нейросеть могут протестировать только избранные пользователи. Однако в будущем OpenAI планирует добавить нейросеть в API, чтобы другие разработчики могли создавать приложения с её использованием.