Google запускает сервис генерации картинок по описанию и образцу StyleDrop
Программа StyleDrop, разработанная Google Research, позволяет пользователям описывать объекты и указывать художественные стили, в которых они хотели бы получить результат. StyleDrop создает изображения, отражающие спецификации пользователя, примерно за три минуты.
«Предложенный метод универсален и позволяет улавливать нюансы и детали стиля, заданного пользователем, такие как цветовые схемы, тени, образцы дизайна, локальные и общие эффекты», — говорится в отчете Google «StyleDrop: генерация текста в изображение в любом стиле».
StyleDrop также создает типографику, которая точно передает стилистические особенности изображений.
Пользователи могут предложить изображение моста или буквы, а затем указать стиль рисунка. Это может быть «золотой рендеринг», «деревянная скульптура», «3D-рендеринг», «мультяшный рисунок» или любой другой стиль. Воображение — единственный предел.
Затем StyleDrop создаст визуализацию объекта с «оплывшим» мостом в стиле Дали (Смотрите заходную картинку — второй ряд левое изображение.)
StyleDrop работает в связке с Muse - другим генератором изображений от Google, представленным ранее в этом году, который обеспечивает высокую степень фотореализма. Muse был обучен на 3 миллиардах параметров.
Исследователи оценили точность и качество результатов работы StyleDrop, используя стандартный промышленный метод оценки текста и стиля CLIP, а также отзывы пользователей. Результаты оценки показали, что StyleDrop «убедительно превосходит» другие ведущие методы генерации изображений и текстов, включая DreamBooth, Imagen и Stable Diffusion.
Разработчики рассматривают эту программу, еще не выпущенную в широкую продажу, как помощь арт-директорам и графическим дизайнерам, которые могут создавать изображения определенных продуктов или тем, включая типографику, отражающую те же цвета, структуру и стиль.
Для кампании нового продукта, скажем, для нового бренда газировки, художник может дать, например, такое описание: «стеклянная бутылка гладкой формы среди тысяч тюльпанов, сопроводительный текст написан буквами из стекла с трехмерной визуализацией в стиле импрессиониста Моне». За три минуты при правильной формулировке может родиться новая рекламная кампания.
Известный типограф Хельмут Шмидт однажды сказал: «Типографику нужно чувствовать. Типографику нужно прочувствовать». StyleDrop вполне может помочь дизайнерам «прочувствовать» этот важнейший момент дизайна.
В описании продукта, однако, признается, что защита авторских прав является проблемой: «Мы признаем потенциальные подводные камни, такие как возможность копирования стилей отдельных художников без их согласия, и призываем к ответственному использованию нашей технологии».
А какие инструкции дал бы да Винчи для StyleDrop? «Нарисуй портрет привлекательной аристократки с неуловимой улыбкой, сидящей на открытом воздухе на фоне горного пейзажа. Нарисуй в стиле Леонардо да Винчи». Вот только, если бы да Винчи так поступал всегда «стиль Леонардо да Винчи» никогда бы не появился.
Леонардо да Винчи писал «Монну Лизу» 16 лет. Новый генератор картинок от Google тратит на работу 3 минуты. Вряд ли у него получится еще одна «Монна Лиза», но помочь дизайнеру разработать фирменный стиль кампании по продаже газировки, он сможет.