Робот научился наводить порядок в незнакомом доме
«Кофейный тест» придумал сооснователь Apple Стив Возняк, чтобы оценить ловкость и уровень интеллекта робота. Тест не умеет четкой формулировки, поскольку сам Возняк его формулировал много раз и всегда немного по-разному.
Но его идея довольно простая. Возняк говорит, что он поверит в интеллект робота, если робот войдет в случайный дом, пройдет на кухню, найдет кофе и кофе-машину, сварит кофе и разольет его по чашкам. Главная трудность этого теста в том, что робот должен все это проделать в незнакомой среде. А значит он столкнется с целой серией трудностей — и кофе находится в разных местах, и кофе-машины разные, и чашки. В этом и смысл теста.
И вот сделан серьезный шаг с выполнению «кофейного теста».
ОК-Robot, положи вещи на место
Команда робототехников из Нью-Йоркского университета разработала робота, который способен подбирать определенные объекты в незнакомой комнате и размещать их в новом месте, то есть фактически наводить в комнате порядок.
Исследователи отметили, что модели визуального языка (VLM) значительно продвинулись за последние несколько лет и стали очень хорошо распознавать объекты на основе языковых подсказок. Ученые также отметили, что навыки роботов также улучшились: они могут захватывать предметы, не ломая их, и переносить в нужные места. Но до сих пор мало что было сделано для объединения VLM с квалифицированными роботами.
В рамках нового исследования ученые попытались сделать именно это с помощью робота, разработанного компанией Hello Robot. У него есть колеса, шест и складные стержни с захватами. Исследовательская группа предоставила роботу предварительно обученный VLM и назвала модель OK-Robot.
Робота приносили последовательно в 10 домов волонтеров, где с помощью iPhone создали 3D-видео и передали их роботу, чтобы тот смог получить общее представление о планировке конкретного дома. Затем робота принесли в комнату, где он никогда не был, и попросили выполнить несколько простых задач, например, «переместить розовую бутылку с полки в мусорное ведро».
Всего робот выполнял 170 таких задач, но он смог выполнить их успешно только в 58% случаев. Исследователи обнаружили, что они могут повысить показатель успеха до 82%, если они сами наведут порядок «на глазах» робота, а он будет смотреть и учиться.
Исследовательская группа отмечает, что их система использует алгоритм нулевого старта (zero-shot), то есть робот не обучался в той среде, в которой он работал (то есть выполнял конкретные задачи). Ученые считают, что достигнутый ими уровень успеха доказывает жизнеспособность робототехнических систем на базе VLM.
Ученые предполагают, что их работа может стать первым шагом на пути к созданию усовершенствованных роботов на базе VLM.
Можно предположить, что следующим шагом будет как раз попытка выполнить «кофейный тест». Для этого уже многое готово.