Реклама пива, созданная нейросетью, стала вирусной: она ужасная и очень странная
30-секундное видео под названием «Синтетическое лето», впервые появившееся в Instagram (принадлежит запрещенной в России организации Meta, признанной экстремистской) около недели назад, создано Хелен Пауэр и Крисом Бойлом из лондонской производственной компании под названием Privateisland.tv.
Судя по всему, специалисты создали видео при помощи нейросети Gen-2 от Runway, которая может создавать короткие видеоклипы на основе текстовых подсказок, аналогично тому, как Stable Diffusion может создавать неподвижные изображения.
Реклама пива от нейросети
В видеоролике под песню Smash Mouth «All Star», мы видим симулякры людей, веселящихся на стереотипном американском барбекю на заднем дворе, иногда физически сливающихся с импрессионистическими пивными сосудами. Женщины смеются, оскалив челюсти. Пивные бокалы превращаются в пивные банки. Пылающие грили становятся огненными торнадо и по дуге пересекают двор. Это видение сюрреалистического ада, которое одновременно знакомо и впечатляюще чуждо.
Почему это выглядит так странно? Все дело в том, что на данный момент нейросети для генерации видео все еще примитивны. Поскольку их создатели обучают модели, они работают с гораздо меньшим набором исходных материалов, чем модели синтеза искусственного интеллекта на неподвижных изображениях, а запуск таких моделей на серверах обходится значительно дороже традиционных генераторов изображений.
Импрессионистский взгляд на рекламу пива, вероятно, возникает из-за впитывания сути реальной рекламы пива в наборе данных Gen-2. Runway не раскрыла набор данных, используемый для обучения Gen-2, но в документе для Gen-1 (более ранней модели) был приведен «внутренний набор данных из 240 миллионов изображений и пользовательский набор данных из 6,4 миллионов видеоклипов».