SimplePoker: Мы разрабатываем софт, который не является волшебной п...

Представляем вашему вниманию интервью с командой Simple Poker специально для Pokeroff. Simple Poker являются авторами таких известных программ, как Simple Nash и Simple Postflop, а также на подходе солвер по Омахе и Simple 3-Way.

— Как появилась идея зарабатывать на покерном софте?

Сначала мы были знакомы с покером на любительском уровне. Потом увидели, что в покере есть много платных программ, которые пользуются популярностью. Программирование, математика и оптимизации — сильные стороны нашей команды и мы нашли область продуктов для покера, которая была слабо развита и где мы могли применить наши компетенции.

— Какие сложности были на первом этапе развития компании? Поиск инвестора, рекламный бюджет, найм работников?

Маленькая команда и очень большой объем работ, как по развитию продуктов, так и по их поддержке. Плюс ко всему привлечение новых сотрудников в нашу команду весьма проблематично из-за специфики предметной области.

Simple Poker для всех участников нашей команды — это больше чем просто работа. Для нас это образ жизни

— Покерные солверы, как Simple Postflop, дали толчок в понимании покера многим топ-регулярам. Но любитель никогда не будет изучать сложные программы. Любитель играет "с душой". Не чувствуете ли вы при этом чувство вины, что одни игроки обречены раз за разом нажимать кнопку «Депозит», а другие наживают на их невежестве?

Мир вообще жестокая и несправедливая штука :)

На самом деле в любой области и сфере есть, как профессионалы, так и любители, и они преследуют разные цели. Профессионалы всегда работают на результат, любители же просто получают удовольствие от процесса. Мы разрабатываем инструмент для профессионалов, который не является волшебной палочкой, а вознаграждает упорный труд и потраченное на покерную теорию время — мы считаем это справедливым.

— Знаю, что одним из главных направлением вашей компании является разработка солвера по PL Omaha и Simple Postflop для банков на троих игроков. Логично предположить, что через пять-шесть лет будет полностью посчитан 6-мах и 9-max в обоих играх и покер будет решён. Нет ли чувств сожаления по этому поводу?

Решение 6-макс и 9-макс очень амбициозная задача и пока что нам верится, что её возможно точно решить в обозначенные сроки. Если же рассматривать эту задачу с точки зрения равновесных стратегий, то отклонения нескольких игроков от оптимальной стратегии можно рассматривать как кооперативную игру и тут уже задача по поиску оптимума значительно усложняется. Игра будет жить и после её решения, как например это сейчас происходит в шахматах, да и в ХА холдеме, где уже компьютер обыграл человека. В любом случае, с помощью добавления дополнительных правил, существующие игры можно значительно усложнить таким образом, что их едва ли можно будет решить, используя текущие технологии и вычислительные мощности.

Чувств сожаления нет, прогресс неумолим и этими задачами занимаемся много других людей, так что если не мы будем на передовой, значит будет кто-то другой вместо нас. Более того, мы рассчитываем, что наши технологии смогут найти себе применение и в других областях, для решения других задачах, поэтому надеемся, что наши труды не канут в лету.

— Боты в покер-румах стали настоящей проблемой для современного онлайн-покера. Некоторые покерные сети просто наводнены ботами, по крайней мере, на покерных форумах постоянно всплывают разоблачения на эту тему. Прокомментируете?

С нашей стороны мы сделали всё возможное, чтобы не предоставлять наши решения для использования ботам. Формат решений закрыт, api к движку расчётов мы не предоставляем. Безусловно есть много коммерсантов, которые видят, что на ботах можно делать легкие дeньги в румах и пользуются этим шансом — современные технологии способствуют этому.

В сентябре под эгидой сбербанка состоялся хакатон, марафон среди хакеров, программистов, на котором команды соревнуются в создании программного обеспечения.

Целью Sberbank Holdem Challenge было создание самого умного покерного бота в Холдеме 9-макс. В итоговом зачёте команда Simple Poker заняла 3-е место, но их бот в турнире сумел обыграть не только других ботов, но и людей.

— Поздравляем с 3-м местом! Расскажите, какова была основная цель участия в хакатоне Сбербанка? Пиар, заработок или просто весело провести время?

Безусловно, мы весело провели время. Можно сказать, что данное мероприятие было для нас тимбилдингом. Нам нравится формат хакатонов, когда тебе приходится не спать по 40 часов, и кофеин перестаёт работать. Мы интересуемся направлением Machine Learning, а здесь ещё и предметная область оказалась нам очень хорошо знакома. Поэтому, как только узнали о конкурсе, сразу же не минуты не думая, решили в нем участвовать.

— Что хотела достичь ваша команда в этом турнире? Занять первое место? Или попасть в десятку лучших?

Мы хотели посмотреть, насколько далеко смогут продвинуться участники, использующие Machine Lerning в создании бота, и увидеть какие-нибудь новые идеи для себя. Цели занять первое место у нас было. Зато была цель попасть в финал (в топ-9), с которой мы успешно и без напряжения справились. А 3-е место для нашего достаточно простого бота было приятной неожиданностью.

— От Simple Poker за третье место вышли получать награду 4 человека, а за первое и второе — по одному. Неужели, четыре головы — хорошо, а одна — лучше?

Мы работали в команде, распределяли ответственность и задачи между собой, поэтому и награду получали все вместе. Но я не сомневаюсь, что каждый из нас мог бы написать бота лучшего, чем подготовила команда. В наше оправдание могу также сказать, что в соревнованиях было много команд, в которых было по 4 и больше человек, которые не выходили на награждение :)

Заслуженно же победил Дмитрий Шагин, ещё раз через Покерофф передаём ему поздравления.

— Ведущий показывал раздачи в 9-макс, где боты соперничали между собой. Так плохо не играли даже в 2007 году. Осталось впечатление, что уровень игры ботов в среднем был ниже плинтуса (лимпы и пр.). Почему так?

В первую очередь это связано с тем, что был выбран наиболее сложный формат игры для написания бота — 9-макс стол без роста блайндов. А это большая размерность стола и глубокие стеки. В этих условиях написание хорошей системы правил является весьма трудоемкой задачей.

Реализовать же бота с помощью Machine Learning и в частности Reinforce Learning также невероятно сложно для такого формата. Нужно ещё понимать, что длительность финального этапа была всего 24 часа, поэтому сделать какой-нибудь Rocket Science в отведенное время было нереально. Если полученные в результате мероприятия решения продолжать развивать, можно в итоге получить даже что-нибудь адекватно играющее.

SimplePoker: Мы разрабатываем софт, который не является волшебной палочкой