ИИ научили создавать изображения любого возраста и сохранять все идентифицирующие признаки

Исследователи Нью-Йоркского университета разработали новую методику искусственного интеллекта, позволяющую изменять видимый возраст человека на изображениях, сохраняя при этом его уникальные идентификационные признаки.
Владимир Губайловский
Владимир Губайловский
ИИ научили создавать изображения любого возраста и сохранять все идентифицирующие признаки
Пенелопа Крус не может постареть. Нижний ряд (ours) работа новой нейросети по сравнению с нейросетью IPCGAN (Identity Preserved Generative Adversarial Networks). https://arxiv.org/pdf/2307.08585.pdf
Новый метод (латентная диффузионная модель) работает очень экономно. Фактически, нейросеть сама себе «придумывает» данные, на которых и обучается.

Исследователи Нью-Йоркского университета разработали новую методику искусственного интеллекта, позволяющую изменять видимый возраст человека на изображениях, сохраняя при этом его уникальные идентификационные признаки.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Ученые обучили один из типов генеративных моделей ИИ (латентная диффузионная модель) выполнять трансформацию возраста с сохранением идентификации. Им удалось обойти типичную для такого рода работ проблему — сбор большого набора обучающих данных, состоящего из изображений, на которых изображены отдельные люди за многие годы.

Вместо этого команда обучала модель на небольшом наборе изображений человека, и на отдельном наборе изображений с подписями, указывающими возрастную категорию: ребенок, подросток, молодой взрослый, среднего возраста, пожилой или старый. В этот набор вошли изображения знаменитостей, запечатленных на протяжении всей их жизни.

Сначала модель обучалась биометрическим характеристикам, по которым идентифицировались люди из первого набора. Потом на изображениях с возрастными подписями модель обучалась взаимосвязи между изображениями и возрастом. Обученная модель может быть использована для имитации старения или омоложения: достаточно указать целевой возраст.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
Первая колонка — оригинал. Остальные получены нейросетью с учетом возрастной категории.
Первая колонка — оригинал. Остальные получены нейросетью с учетом возрастной категории.
https://arxiv.org/pdf/2307.08585.pdf
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Для управления процессом формирования изображения используются текстовые подсказки и метки классов, при этом особое внимание уделяется сохранению деталей, характерных для конкретного лица, и общему качеству изображения.

https://arxiv.org/pdf/2307.08585.pdf

Для точной настройки нейросетевой модели используются различные функции оптимизации, а эффективность метода продемонстрирована в ходе экспериментов по созданию изображений человеческих лиц с возрастными изменениями и контекстными вариациями.