Продолжаем публикацию интервью Эрика Джексона - бывшего сотрудника Google, а ныне разработчика покерных ботов. С предыдущей частью вы можете ознакомиться здесь.
Расскажи нам подробнее о конкурсе Computer Poker Competition?
Computer Poker Competition - ежегодный конкурс для людей, увлекающихся созданием покерных ботов, и исследователей в этом направлении. Прошлогодним летом прошел девятый в своей истории конкурс. Традиционно конкурс подразумевает соревнование в трех областях: HU Limit Hold'em, HU No-Limit и Limit Hold'em для трех игроков. Недавно у нас появился конкурс Kuhn Poker для трех игроков [сильно упрощённая версия холдема с колодой из трёх карт]. Участниками конкурса являются как исследователи, так и сами игроки. Особую активность на протяжении последних лет проявляли представители Университетов Альберты и Карнеги-Меллон.
Конкурс стимулирует исследования в различных сферах ботоведения, включая создание статических ботов (каких делаю я, например), которые пытаются максимально приблизиться к равновесию Нэша, и подстраивающихся, которые пытаются эксплуатировать стратегию оппонента.
Kuhn Poker? Версия для двух игроков была специально разработана, как легко решаемая игра. С бОльшим количеством игроков ситуация меняется? Какие были мотивы для ее включения в конкурс?
Несмотря на то, что это простая игра, версия для бОльшего количества игроков не может быть решена в техническом смысле. Если бот играет по стратегии максимально приближенной к равновесию Нэша и не может быть эксплуатируем, он может быть побежден, если два других бота выберут адекватно согласованные стратегии. Так что целью, на мой взгляд, было найти довольно простую игру, на примере которой можно было бы сосредоточиться на различиях между игрой для двух и большим количеством игроков, например, относительно недостатка неэксплуатируемого равновесия и возможности сговора. Несмотря на то, что игра проста, найти лучший способ максимизации прибыли довольно непросто.
Говоря о решениях, недавно появилась новость о том, что Лимитный хедз-ап Холдем был, наконец, решен. Это значит, что больше он не будет представлять интереса для включения в конкурсную программу. Что, на твой взгляд, может заменить его?
На самом деле, для каждой игры у нас есть два соревнования. В первом поощряются боты, максимально приблизившееся к равновесию Нэша, во втором основным критерием оценки является общая прибыль бота, играющего по эксплуатационной стратегии против более слабых оппонентов. Таким образом, да, первое соревнование для Лимитного Холдема теперь становится бессмысленным, но во второе все еще имеет место быть.
Что касается нового соревнования, я бы хотел увидеть что-нибудь на самом деле трудное и особенное, например, fullring или 6max. Но в этом есть некоторые технические трудности. Так, например, я не уверен, что полученные нами результаты будут иметь статистическую значимость.
Итак, некоторые (включая тебя) пишут неэксплуатирующих ГТО-ботов, которые должны играть «идеально» относительно теории игр. Другие же создают ботов, которые стараются эксплуатировать слабости своих оппонентов. Какой из этих подходов более популярен в нерешенных (или решаемых) играх в последнее время?
В нашем конкурсе ГТО-боты, которые максимально близко играют к Равновесию Нэша, как правило, выигрывают эксплуатационных ботов в ХА. Этому есть несколько объяснений. Адаптироваться само по себе трудно. ГТО-боты довольно сильные, а работа в области адаптации, возможно, находится в менее зрелом состоянии, чем работа в области ГТО. Кроме того, конкурсные матчи длятся всего 3000 рук. Такое количество может быть не достаточным, чтобы узнать что-то особенное о своем сопернике, если вы не делаете много предположений и эти предположения оказываются правильными.
Как близко вы находитесь к решению таких игр, как No-Limit Hold'em? ГТО-боты уже готовы или вам все еще предстоит долгий путь?
Помимо лимитного хедз-апа, на данный момент решены только простые игры (такие как Kuhn Poker для двух игроков), которые не представляют интереса. Главным, что помогло решить Лимитный холдем, стала возможность точно измерить эксплуатабельность. Мы не можем сделать то же самое для наших ботов в безлимитном Холдеме, но ребята из Университета Альберты смогли найти, по крайней мере, нижнюю границу эксплуатабельности одного из своих недавних ботов, и выяснилось, что она равнялась, как минимум, 300 большим блайндам на сто рук! Хоть это и кажется шокирующим (в четыре раза хуже, чем просто фолдить каждую руку), помните, что эксплуатабельность - наихудший теоретический показатель. В реальной игре против человека, большинство ликов будут очень тонкими, и боту все равно будет довольно сложно играть. Так что еще одна замечательная новость для людей — Безлимитный Холдем все еще очень далек от решения.
Computer Poker Competition подразумевает соревнования только ботов против ботов? Или же есть подобные конкурсы, где боты соревнуются против людей?
До того, как Лимитный хедз-ап был решен, проводилось несколько матчей «человек против бота». Я думаю, что подобные матчи имели бы большой интерес в попытках решения Безлимитного холдема. Однако для того, чтобы убедиться в статистической значимости результатов, нам потребуются тысячи и тысячи рук и человек, готовых отыграть такие объемы.
Продолжение следует...