Ученые обыграли искусственный интеллект в го. Хитрый трюк, который показывает, что ИИ все еще не всесилен
ИИ под названием KataGo изучил го, сыграв миллионы игр против самого себя. Но этого опыта все равно недостаточно, чтобы охватить все возможные сценарии игры. А это, в свою очередь, оставляет место для уязвимостей в программе, в частности, вызванных неожиданным ходами.
«KataGo хорошо подходит для многих новых стратегий, но становится тем слабее, чем дальше она отдаляется от игр, которые видела во время обучения, — говорит один из создателей нового ИИ, сотрудник Калифорнийского университета в Беркли Адам Глив. — Мы смогли обнаружить одну из таких стратегий, к которой KataGo особенно уязвим, но, вероятно, она не единственная».
Переиграть искусственный интеллект
Ученые объясняют, что во время матча в го для победы над ИИ надо сначала сделать ставку на небольшой угол доски. Например, игрок, контролирующий черные камни, может сосредоточиться на правом верхнем углу доски. Противник позволяет KataGo (играющему белыми) претендовать на остальную часть доски, в то время как сам разыгрывает несколько камней, которые легко захватить на этой территории.
«Это заставляет KataGo думать, что он уже победил, — говорит Глив, — поскольку его территория (внизу слева) намного больше, чем у противника. Но нижняя левая территория фактически не влияет на его счет (играют роль лишь белые камни, которые он сыграл) из-за присутствия там черных камней, а это означает, что она не полностью защищена».
В результате своей чрезмерной уверенности в победе — предполагая, что он выиграет, если игра закончится и очки будут подсчитаны — KataGo делает пас, позволяя противнику также намеренно пасовать, завершая игру. (Два последовательных паса заканчивают игру в го.) После этого начинается подсчет очков. Как объясняется в статье, игрок с черными камнями получает очки за свою угловую территорию (лишенную камней второго игрока), в то время как KataGo не получает очков за свою незащищенную территорию из-за наличия камней противника.
Чтобы обыгать ИИ, который наперед просчитывает все ходы, ученые разработали тактику, основанную на уязвимости программы.