Российские программисты победили на международном конкурсе ИИ для Minecraft
Обучение с подкреплением — интересная концепция, в которой обучаемый автомат помещается в некую среду, чаще всего — искусственную, которая, в зависимости от действий автомата, выдает ему поощрительные либо негативные оценки, в результате чего автомат изменяет свое устройство и правила принятия решений, стремясь к тому, чтобы «пряников» было больше, чем «кнутов». Разумеется, он должен отличать одно от другого и предпочитать «пряники».
Как сообщается в пресс-релизе МФТИ, сотрудники и стажеры лаборатории когнитивных динамических систем МФТИ и Института проблем искусственного интеллекта ФИЦ ИУ РАН — Алексей Скрынник, Эрмек Айтыгулов, Алексей Староверов, Кирилл Аксенов, Василий Давыдов и Александр Панов — предложили новый подход к обучению с использованием нового механизма забывания.
«Команда лаборатории достигла отличного результата, достойно представив Физтех и Россию на международной конференции. Игровая среда Minecraft, в которой мы смогли продемонстрировать интеллектуальное поведение агента, реализует большое разнообразие разных типов взаимодействия человека со сложной, непредсказуемой внешней средой. В этом плане она является отличным симулятором, приближенным к реальности, и для нее намного сложнее разрабатывать методы обучения поведения, чем для таких сред как Go, Dota или Starcraft. Предложенный нами метод открывает новые пути для применения обучения с подкреплением уже в прикладных задачах, таких как беспилотный транспорт и роботы-манипуляторы», — сказал заведующий лабораторией когнитивных динамических систем Центра когнитивного моделирования Александр Панов.
«MineRL — это соревнование для интеллектуальных алгоритмов, а не вычислительных возможностей. До этого многие достойные результаты в области искусственного интеллекта достигались за счет "грубой силы" — большого количества GPU и CPU для обучения сложных систем, — добавил директор Физтех-школы прикладной математики и информатики Андрей Райгородский. — Как только в требования добавилась необходимость разработки вычислительно-эффективных методов, шансы всех команд уравнялись. В таких условиях наши ребята оказались лучше всех, опередив команды из США, Китая, Японии, Финляндии, Германии и других стран. Это в очередной раз подтверждает, что Физтех в целом и ФПМИ в частности — мировые лидеры в области искусственного интеллекта. И это на самом деле закономерно, потому что в Физтех-школе построена уникальная система взаимодействия академических базовых организаций и индустриальных партнеров..
Соревнование длилось пять месяцев, в нем было два раунда. В первом российская команда заняла третье место, во втором — обошла девять финалистов и заняла первое место с существенным отрывом. В конкурсе участвовали более 40 команд со всего мира.