Бьорн Ли: «То что бот сможет бить HUNL - всего лишь вопрос времени»

Для тех, кто жил за печкой – с 24 апреля по 8 мая 2015 года четыре лучших хедзапера пытались одолеть новейший покерный бот "Claudico", разработанный учеными Университета Карнеги-Меллон (CMU). Команду людей представляли Даг Полк (WCGRider на PokerStars), Бьорн Ли, Донг Ким и Джейсон Лес.

Само событие стало первым в истории HUNL соревнованием между людьми и искусственным интеллектом. До этого момента компьютерам доводилось осваивать только Fixed Limit.

Борьба проходила на лимите $50/$100, и каждая рука начиналась с 200 больших блайндов. По истечению 80k рук люди обыгрывали бота с винрейтом 9bb/100. Несмотря на то, что матч официально завершился ничьей, человечество все еще может спать спокойно. Искусственный интеллект пока не готов захватить мир покера.

Самый лучший результат показал Бьорн Ли, «забрав» у искусственного интеллекта $529,033. В этом интервью он поделится своими мыслями по поводу матча и не только.

Несмотря на то, что матч официально завершился ничьей, ты разорвал бота и показал самый лучший результат из всей команды. Как ты думаешь, с чем связан твой успех?

Думаю, что отчасти мне везло, а отчасти я делал правильные вещи в правильных местах. На мой взгляд, бот оверфолдил во многих ситуациях, так что я пытался эксплуатировать его столько, сколько мог, зная, что это статический GTO-бот, который не сможет подстроиться. Конечно, имея такой результат, я просто не могу не сказать о факторе удачи. Например, я часто получал фолды, когда блефовал на ривере, и часто коллы, когда был с велью-рукой. Так что в целом дисперсия не успела наказать меня.

Ты выиграл большую часть фишек в первой половине матча. Потом начались разговоры о том, что Claudico стал играть лучше, сделав определенные подстройки. Чувствовал ли ты во второй половине матча, что играешь с более сильным оппонентом, и если да, могло ли именно это привести матч к ничье?

Да, он наверняка сделал определенные подстройки, хотя их было далеко не достаточно для того, чтобы выиграть у нас этот матч. Например, он избавился от действительно больших ошибок, убрав большой сайзинг (олл-ин), так что больше он не допускал дорогостоящих ошибок с неправильными руками. Тем не менее, у него все еще осталось несколько других областей, в которых его игра сильно страдала.

WCGRider отметил, что в некоторых ситуациях Claudico минбетил или сильно овербетил. Например, он мог поставить $19,250 в банк $700, что «человек никогда бы не сделал». Команда разработчиков бота была озадачена этой проблемой, но так и не смогла проанализировать стратегию Claudico (два терабайта данных). Как ты думаешь, почему бот творил такие вещи?

Продолжая ответ на предыдущий вопрос, в первой половине матча у Claudico был олл-ин сайзинг на ривере, что само по себе может быть хорошей стратегией. Единственной проблемой было то, что он не делал этого с правильными диапазонами и, в частности, не использовать эффект блокеров. Широкий диапазон ставок в каждой конкретной ситуации, безусловно, выходит за рамки GTO/Равновесия Нэша. Таким образом, я бы не сказал, что это вызывало недоумение в моих глазах. Вопрос лишь в том, было ли это хорошо реализовано.

На 80K зеркальных рук команда людей имела общий винрейт 9bb/100. В послематчевом интервью WCGRider сказал, что Claudico был очень сильным соперником, но, на его взгляд, результатом была точно не ничья, учитывая такие результаты. Согласен ли ты с ним? Аналитики отметили, что некоторые из слабых сторон бота не были занесены в статистику.

Факт в том, что команда людей обыграла бота с винрейтом 9bb/100 на 92 процентном доверительном интервале. Так что, если вы спросите меня, думаю ли я, что это было действительно ничьей, я отвечу, что есть 8 процентная вероятность того, что люди продули бы этот матч, хотя, на мой взгляд, этот процент немного ниже. Я точно уверен, что люди играли далеко не в оптимальных условиях. Порой мы уставали, нам было скучно, и это несмотря на то, что мы играли с открытыми картами.

WCGRider заявил, что Claudico может бить HU лимиты до NL400. Как думаешь ты?

Он может бить большинство регов HUNL 400-600. Но 1k и выше уже будет даваться ему сложнее.

Дала ли тебе игра против самого сильного покерного бота в мире определенное велью по части собственной игры? Улучшилась ли твоя игра? Если да, то как?

Я бы сказал, что практически все стратегические мувы, которые использовал бот, уже давно и хорошо мне известны, и я сам успешно применяю их в собственной игре. Например, использовать разные размеры ставок на ривере считается золотым стандартом в современном HUNL, хотя это может быть не так очевидно многим другим игрокам. Бот также минлидил на ривере 1/10 банка после чек-колла 2-х улиц, что, на мой взгляд, тоже может хорошо работать против реальных оппонентов.

В послематчевом интервью ты сказал, что в один прекрасный день искусственный интеллект, так или иначе, обгонит нас. Как скоро, на твой взгляд, придет судный день для безлимитного Холдема?

Я думаю, через год-6 лет. То что бот сможет бить HUNL - всего лишь вопрос времени. Ведь для HUNL есть GTO решение/Равновесие Нэша, и когда бот в конечном итоге сможет играть идеальный GTO, он будет непобедим (т.е. у него больше не будет ликов).

Ты несколько раз играл с WCGRider’ом на PokerStars. В интервью он сказал, что в будущем он еще собирается потягаться с тобой. Также он считает себя игроком №1 в мире в HUNL. Как ты думаешь, на чьей стороне преимущество, и когда вы снова встретитесь в онлайне?

Я думаю, что у него все еще есть преимущество надо мной, возможно, где-то в диапазоне 1-4бб/100, хотя отмечу, что это возможно. Мы определенно когда-нибудь еще сыграем с ним HU-матч, но сейчас у нах обоих есть более прибыльные дела.