Искусственный интеллект научился генерировать целые фильмы: новый этап в кинематографе
В чем суть теории оптимального транспорта?
Представьте ситуацию, когда нужно доставить грузы из нескольких точек в разные другие пункты. Задача состоит в том, чтобы сделать это максимально экономично — потратить меньше топлива, времени и ресурсов на переезд между разными местами назначения. Теория оптимального транспорта помогает найти такой способ, который минимизирует эти затраты.
В контексте генеративных моделей ИИ эта идея применяется к тому, как данные преобразуются внутри модели. Вместо физического перемещения грузов речь идет о «переносе» различной информации из одного состояния в другое. Алгоритм старается изменить исходные данные так, чтобы результат был похож на ожидаемый, при этом внося минимальное количество изменений.
Как ИИ создает фильмы?
В 2024 году научная группа по Генеративному ИИ Сколтеха под руководством Александра Коротина занималась разработкой новых алгоритмов для построения генеративных моделей, основанных на теории оптимального транспорта. Эти алгоритмы использовались для создания моделей, которые способны генерировать изображения с повышенным разрешением и более качественно обрабатывать доступные иллюстрации. В частности благодаря этой разработке сегодня, в 2030 году, нейросети могут не только создавать изображения высокого разрешения, но и изготавливать целые фильмы с качественным сюжетом, реалистичными персонажами и продуманной атмосферой.
Производство кино генеративными моделями проходит практически так же, как у людей. Все начинается с идеи — ее задает пользователь. Далее прописывается сценарий: человек создавал бы истории на основе личного опыта, интуиции и творческом видении, а алгоритмический рассказчик черпает вдохновение из коллективного кинематографического опыта, предлагая новые взгляды и неожиданные повороты сюжета. Затем ИИ анализирует сюжет и определяет ключевые элементы, включая персонажей, места действия и основные конфликты.
После этого происходит этап генерации, в ходе которого нейросеть создает визуальные изображения каждой сцены, а также генерирует звуковую дорожку для фильмов. Сегодня ИИ может создавать не только диалоги, но и музыкальные композиции, которые идеально дополняют визуальный ряд, обеспечивая уникальный звуковой опыт для зрителей.
P.S. Приведенные в тексте факты, якобы имевшие место позднее 2024 года, являются вымыслом. Однако корневые события сюжета, датируемые 2024 годом, совершенно реальны
Эксперт: Александр Коротин, кандидат физико-математических наук, старший преподаватель и руководитель исслеедовательской группы по Генеративному ИИ Сколтеха.
Реклама. ПАО «Сбербанк». Erid: 2W5zFHKo18U