OpenAI доработала свою нейросеть: теперь она умеет делать более качественные изображения по текстовому описанию
DALL-E 2 – обновленная нейросеть от OpenAI, которая умеет генерировать более детальные картинки по текстовому описанию.
К примеру, описание «космонавт», «верхом на лошади» и «в фотореалистичном стиле» привело к генерации такого изображение:
Самое поразительное в том, что обновленная нейросеть самостоятельно понимает, как и в какой позе посадить космонавта на лошадь и знает, что такое фотореализм.
Согласно сайту OpenAI, нейросеть умеет не только генерировать изображения, но и редактировать их. По запросу она может изменить некоторые детали фото, добавив или убрав конкретные элементы.
А это миска-монстр из пряжи, которую также создала DALL·E 2:
Как работает DALL-E?
Согласно описанию, «DALL·E 2 изучила взаимосвязь между изображениями и текстом, используемым для их описания. Она использует процесс, называемый "рассеиванием", который начинается с узора из случайных точек и постепенно изменяет этот узор в сторону изображения, когда нейросеть распознает определенные аспекты этого образа».
Пока нейросеть могут протестировать только избранные пользователи. Однако в будущем OpenAI планирует добавить нейросеть в API, чтобы другие разработчики могли создавать приложения с её использованием.
Некоторые изображения по-настоящему удивляют