Нейросеть записала дисс Эминема на Марка Цукерберга
Современные нейросети способны легко имитировать голос людей, заставляя их говорить те фразы, которые захочет пользователь. Более того, такие программы могут менять мимику, расу, фигуру и волосы человека. Таким образом, с помощью такой технологии можно «заставить» реального человека делать и говорить на видео то, что хочется пользователям нейросети.
Одна из таких программ — GPT-3 — является бесплатной и доступна через сервис Shortly Read. Именно ее использовали создатели YouTube-канала Calamity Ai, чтобы записать песню Эминема, в которой он всячески издевается над главой Facebook (Социальная сеть признана экстремистской и запрещена на территории Российской Федерации) Марком Цукербергом.
Видео идет почти три минуты, в ходе которых почти каждая цитата рэпера сопровождается видеорядом. По словам самих создателей видео, в своей работе они использовали две программы — нейросеть GPT-3 генерировала текст дисса, а 30Hz воссоздала голос Эминема.
В результате программа смогла воспроизвести не просто голос музыканта, но и его характерные восклицания и интонацию. В сочетании с музыкой, которую рэпер использовал примерно 20 лет назад, дисс напоминает более ранние композиции Эминема. Если не знать, что текст и голос для этого трека сгенерировала нейросеть, то догадаться об его «искусственном» происхождении практически невозможно.
Сегодняшние нейросети способны на многое. Но их совместная работа может делать, казалось бы, невозможные вещи. Например, писать оскорбляющие тексты и читать их голосом Эминема под бит 2000-х годов. Звучит, кстати, очень похоже на настоящего рэпера