Нейросеть научилась составлять рецепт пиццы

Программисты российского бренда «Додо-пицца», совместно со специалистами по нейросетям из МФТИ и Сколтеха, написали программу, составляющую рецепт пиццы. При этом учитывается молекулярная совместимость исходных продуктов.
Нейросеть научилась составлять рецепт пиццы

Пицца получила название Open Source. Ее рецепт и исходный код искусственного интеллекта выложены в открытый доступ и доступны для использования в любых целях, в том числе коммерческих.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Чтобы научиться находить неочевидные связи между ингредиентами и понимать, как они сочетаются друг с другом, искусственный интеллект проанализировал более трехсот тысяч рецептов, а также результаты научных исследований о молекулярной сочетаемости ингредиентов.

Получившийся рецепт включает десять ингредиентов — как традиционных (томатный соус, цыпленок, томаты черри, брокколи, моцарелла), так и очень необычных (дыня, груша, тунец, мята, мюсли).

«Опенсорс» пицца была создана в качестве эксперимента, чтобы проверить, возможно ли структурно описать такое субъективное явление, как вкус, и возможно ли научить искусственный интеллект находить необычные сочетания ингредиентов, которые покажутся вкусными большинству людей.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

«Генерация кулинарных рецептов — не самая распространенная задача, генерация именно пицц — тем более. Самым сложным, как это обычно бывает при работе с машинным обучением, был сбор датасета — нигде таких баз нет, приходилось автоматически обрабатывать крупные кулинарные сайты, а на сайтах пишут рецепты пользователи, из-за чего возникают всяческие неприятности вроде ошибок в тексте», — говорит один из разработчиков Егор Барышников.

Первоначальный датасет включал около 300 000 рецептов и около 1 000 уникальных ингредиентов. Чтобы нейросеть могла работать с рецептами, их нужно было описать в математическом виде. Чтобы это сделать, разработчики представили рецепт как набор векторов ингредиентов. Вектора ингредиентов были сформированы с помощью Skip-Gram Negative Sampling (SGNS) — алгоритма word2vec, который основан на встречаемости слов в контексте.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

После того как была решена задача создания рецепта пиццы, в модель был добавлен критерий молекулярной сочетаемости на основе результатов исследования ученых из Кембриджа и нескольких университетов США. Они установили, что лучше всего сочетаются ингредиенты с похожей молекулярной структурой.

Научившись создавать рецепт пицц, с помощью регулировки коэффициентов, нейросеть может придумывать как классические рецепты (например, «Маргариту» или «Пепперони»), так и сумасшедшие рецепты с грушей, тунцом и мятой, который и стал основой для «Опенсорс» пиццы.

Подробнее о проекте можно прочитать на специальном сайте проекта.