Исследователи из Корнельского университета разработали новую роботизированную систему на основе искусственного интеллекта под названием RHyME (Retrieval for Hybrid Imitation under Mismatched Execution), которая позволяет роботам изучать и решать задачи, посмотрев только одно обучающее видео.
ИИ учит роботов выполнять задания на основе одного видеоролика

Система RHyME может ускорить разработку и развертывание роботизированных систем, значительно сократив время, энергию и деньги, необходимые для их обучения, говорят исследователи.

«Одной из раздражающих вещей в работе с роботами является сбор большого количества данных о том, как робот выполняет различные задачи», — сказал соавтор работы Кушал Кедиа. — «Люди выполняют задачи не так». Мы смотрим на других людей как на вдохновение». Описание проекта представлено на сайте RHyME.
Перевод с языка человека на язык роботов

Домашние роботы-помощники пока еще далеки от реальности. Им не хватает сообразительности, чтобы ориентироваться в физическом мире и его бесчисленных непредвиденных обстоятельствах. Чтобы роботы стали быстрее, исследователи, такие как Кедиа, обучают их с помощью видеороликов — демонстраций людьми различных задач в лабораторных условиях. Этот подход к машинному обучению называется «имитационным обучением».
«Наша работа похожа на перевод с французского на английский — мы переводим любую заданную задачу с человека на робота», — сказал соавтор работы Санджибан Чоудхури. Но эта задача «перевода» по-прежнему сталкивается с более широкой проблемой: люди двигаются слишком плавно, чтобы робот мог отслеживать и имитировать их движения, а обучение роботов с помощью видео требует его огромных объемов роликов.
Кроме того, видеодемонстрации — например, поднятия салфетки или складывания тарелок — должны выполняться медленно и безупречно, поскольку любое несоответствие в действиях между видео и роботом исторически означало провал для обучения роботов, говорят исследователи.
«Но если человек движется так, как двигается робот, метод немедленно разваливается», — сказал Чоудхури. — «Мы думали: "Можем ли мы найти принципиальный способ справиться с этим несоответствием между тем, как люди и роботы выполняют задачи?"»

RHyME — это ответ команды — масштабируемый подход, который делает роботов менее привередливыми и более адаптивными. Он заставляет роботизированную систему использовать собственную память и связывать точки при выполнении задач, которые она просматривала только один раз, опираясь на видео, которые она видела.
Например, робот, оснащенный RHyME, которому показывают видео, на котором человек берет кружку со стойки и ставит ее в ближайшую раковину, прочесывает свой банк видео и находит похожие действия.
RHyME прокладывает путь для роботов к изучению многошаговых последовательностей, при этом значительно сокращая объем данных необходимых для обучения.
Исследователи говорят, что в лабораторных условиях роботы, обученные с использованием этой системы, добились более чем 50-процентного повышения успешности выполнения задач по сравнению с другими методами.