ИИ научили создавать изображения любого возраста и сохранять все идентифицирующие признаки

Исследователи Нью-Йоркского университета разработали новую методику искусственного интеллекта, позволяющую изменять видимый возраст человека на изображениях, сохраняя при этом его уникальные идентификационные признаки.
ИИ научили создавать изображения любого возраста и сохранять все идентифицирующие признаки
Пенелопа Крус не может постареть. Нижний ряд (ours) работа новой нейросети по сравнению с нейросетью IPCGAN (Identity Preserved Generative Adversarial Networks). https://arxiv.org/pdf/2307.08585.pdf
Новый метод (латентная диффузионная модель) работает очень экономно. Фактически, нейросеть сама себе «придумывает» данные, на которых и обучается.

Исследователи Нью-Йоркского университета разработали новую методику искусственного интеллекта, позволяющую изменять видимый возраст человека на изображениях, сохраняя при этом его уникальные идентификационные признаки.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Ученые обучили один из типов генеративных моделей ИИ (латентная диффузионная модель) выполнять трансформацию возраста с сохранением идентификации. Им удалось обойти типичную для такого рода работ проблему — сбор большого набора обучающих данных, состоящего из изображений, на которых изображены отдельные люди за многие годы.

Вместо этого команда обучала модель на небольшом наборе изображений человека, и на отдельном наборе изображений с подписями, указывающими возрастную категорию: ребенок, подросток, молодой взрослый, среднего возраста, пожилой или старый. В этот набор вошли изображения знаменитостей, запечатленных на протяжении всей их жизни.

Сначала модель обучалась биометрическим характеристикам, по которым идентифицировались люди из первого набора. Потом на изображениях с возрастными подписями модель обучалась взаимосвязи между изображениями и возрастом. Обученная модель может быть использована для имитации старения или омоложения: достаточно указать целевой возраст.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
Первая колонка — оригинал. Остальные получены нейросетью с учетом возрастной категории.
Первая колонка — оригинал. Остальные получены нейросетью с учетом возрастной категории.
https://arxiv.org/pdf/2307.08585.pdf
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Для управления процессом формирования изображения используются текстовые подсказки и метки классов, при этом особое внимание уделяется сохранению деталей, характерных для конкретного лица, и общему качеству изображения.

https://arxiv.org/pdf/2307.08585.pdf

Для точной настройки нейросетевой модели используются различные функции оптимизации, а эффективность метода продемонстрирована в ходе экспериментов по созданию изображений человеческих лиц с возрастными изменениями и контекстными вариациями.