Пинг-понг-бот: Прилежный ученик
Программирование роботов для выполнения определенных задач остается непростым делом, несмотря на впечатляющие успехи робототехники. А в непромышленных условиях (в домах, больницах, офисах) ситуация осложняется еще и необходимостью действовать более безопасно в условиях большей неопределенности. Поэтому инженеры стремятся создать роботов, поведение которых будет гибким и адаптивным — роботов, которые, подобно людям, будут учиться на собственном опыте.
Именно эту задачу и решает команда исследователей из Robot Learning Lab (лаборатории, входящей в состав Института Макса Планка, Германия) во главе с Яном Питерсом (Jan Peters). Питерс ставит перед собой цель превратить программирование роботов в обучение. Другими словами, он хочет разработать роботов, каждое движение которых не придется точно просчитывать.
На видео Катарина Мулинг (Katharina Muelling), аспирант Питерса, показывает роботу, как «вести» шарик для пинг-понга, закрепленный на резинке. Робот представляет движения в виде набора базовых «моторных навыков» — и быстро «учится» этому нехитрому трюку. Для сравнения, ученые попытались составить программу для выполнения той же задачи. На это ушло целых три месяца, и результат был не столь хорош, как после «обучения», которое заняло менее часа.
Во второй части видео Мулинг учит робота ловить шарик при помощи чашки. Это гораздо более сложный навык, и роботу для достижения положительного результата недостаточно просто подражать движениям человека. Разница в скорости перемещения руки и манипулятора не позволяет роботу поймать шарик при попытке воспроизвести действия «учителя». И тут, по словам Питерса, на первый план выходит процесс «самосовершенствования». «Каждый раз, когда роботу удается подвести мяч ближе к чашке, он получает "награду", — рассказывает Питерс. В результате "самосовершенствования" на протяжении многих попыток робот осваивает необходимые навыки. Так, первые удачные броски приходятся на 40−45 попытки, а после 90−95 попыток робот добивается стабильного положительного результата.
Какова способность робота к обучению по сравнению с человеком? Этим вопросом задался Йенс Кобер (Jens Kober), один из аспирантов Питерса. В качестве объектов небольшого эксперимента он выбрал своих многочисленных родственников. Оказалось, самые младшие из них (в возрасте до 6 лет) вообще не способны поймать шарик в чашку, те, что чуть постарше (10−12 лет), научились этому за 30−35 попыток, а взрослые справились гораздо быстрее. «Руководитель проекта — пожалуй, единственный человек в лаборатории, кто так и не освоил эту игру», — усмехается д-р Питерс.
В заключительной части видео робот учится игре в пинг-понг. Основная задача здесь состоит в модификации ранее изученных движений в зависимости от визуальной информации (направления полета мяча, выпущенного из подающей машины). Д-р Питерс рассчитывает, что однажды «пинг-понг-бот» если и не станет чемпионом, то, по крайней мере, сможет обыграть всех сотрудников лаборатории.
По сообщению IEEE Spectrum