Покерный солвер

Солвер — это программа, которая, используя вычислительную мощь современных компьютеров, стремится подсказывать покеристу решения, оптимальные с точки зрения теории игр. С некоторыми исключениями, солверы демонстрируют пусть и не совершенный покер, но достаточно близкий к нему. В число самых известных программ такого рода входят Poker Snowie, Holdem Resources Calculator, ICMIZER, PIOSolver и некоторые другие.

Важно помнить, что солвер не всегда вычисляет наиболее прибыльный вариант игры против конкретного оппонента, но находит оптимальное решение, которое невозможно эксплуатировать.

В некоторых солверах в качестве вводных данных можно подставлять диапазоны и тенденции соперника, получая на выходе ещё более выгодное решение, позволяющее эксплуатировать его ошибки. По мере того как солверы становились всё популярнее, программисты находили способы автоматизировать их работу, что сделало этот инструмент ещё более мощным. Но даже с помощью солвера, который вычисляет только решения, неуязвимые для эксплойта, в теории можно добиваться невероятных результатов и выигрывать на самых высоких лимитах.

Когда солверы появились несколько лет назад, покеристы использовали их для обучения. Они загружали в них свои хендхистори и изучали предложенные решения, повышая таким образом уровень собственной игры. Но уже тогда было ясно, что скоро люди найдут способы использовать солверы в процессе реальной игры. По-видимому, это уже происходит, особенно на высоких лимитах, где выигрывать без GTO-стратегии становится очень трудно. Любой серьёзный покерист стремится получить преимущество над соперниками, а солверы, при наличии у игрока определённых навыков, могут дать огромное преимущество даже на самых высоких лимитах.

Если говорить не о читерстве, а об улучшении своей игры с помощью солверов во время тренировок, то неправильный способ их использовать — это брать какую-нибудь трудную ситуацию и ожидать, что солвер даст железный ответ, как в ней нужно играть. Многие люди с помощью солверов пытаются найти готовые рецепты для разных ситуаций и используют этот софт как отговорку, позволяющую им меньше работать над собственной игрой.

Правильный способ использовать солвер — это решить с его помощью какую-то задачу, а затем попытаться выяснить, почему солвер решил её именно так. Часто солвер по-настоящему вас удивит, и вам будет интересно решить задачу самостоятельно, чтобы понять, почему. Вот что имеют в виду, когда говорят, что солверы хороши настолько, насколько хорош покерист, который их использует. Вам всё равно нужно быть любопытным человеком, чтобы извлечь из них какую-то пользу.

В качестве примера, возьмём рассчитанный в солвере диапазон пуша на UTG со стеком 10 ББ на финальном столе нокаут-турнира:

11,9% рук: 88+, 66, A2s+, AJo+, KTs+, KQo, QJs

Не заметили ничего странного? Это последовательный диапазон, за тем исключением, что с парой 66 солвер предлагает пушить, а с парой 77 — почему-то нет.

В процессе решения этой задачи я поначалу принял это за ошибку и сделал повторный расчёт в Holdem Resources Calculator, но всё было верно. Прямо сейчас поставьте чтение на паузу и попробуйте сами сделать такой расчёт.

В конце концов, я пришёл к выводу, что пара 66 немного сильнее пары 77 из-за наличия слишком большого числа рук Ax в диапазоне колла. Особенно сильно это проявляется на борде 2345x: рука 66 здесь будет сильнее 77, потому что шестёрки могут побить руку Ax, когда та соберёт младший стрит, а семёрки — нет.

Солверы дают ответы на наши вопросы, но попытка понять, почему солвер ответил так, а не иначе, даст вам гораздо больше пользы, чем банальное копирование решений солвера во время игры. 

Вернёмся к теме читерства. Как утверждается, у Крузе было два компьютера — с одного он играл, а на другом параллельно запускал солвер. Это весьма правдоподобно и возможно. Огласка его истории лишь подтолкнёт ещё больше игроков задуматься о таком способе мошенничества.

Онлайн покер-румы, как правило, не разрешают использовать подсказчики во время игры, но как им узнать, что игрок использует для солвера отдельный компьютер? Например, технология распознавания изображений в наше время столь хороша, что я не удивлюсь, если кто-то уже сейчас вешает веб-камеру над своим игровым монитором и подключает её к другому компьютеру, который считывает экшен за столами. Вторая машина может подсказывать игроку GTO-решения в режиме реального времени практически без риска того, что покер-рум это обнаружит, потому что два компьютера никак не связаны между собой. Второй из них даже не нужно подключать к интернету.

Есть и другие решения. Даже такую простую систему, которую использовал Крузе, будет довольно трудно обнаружить и ещё труднее — доказать её использование. Переключение с одного компьютера на другой — более трудоёмкий, но определённо выполнимый способ. Способный программист, вероятно, сможет выполнить этот процесс на одном компьютере так, чтобы покер-рум ничего не заметил. Если афера сулит достаточно денег, мошенники найдут способ её провернуть.

Однако службы безопасности покерных сайтов тоже не дремлют. Хотя они не раскрывают принципы своей работы, кое-что об этом известно. Например, GGPokerOK подробно анализирует раздачи игроков при помощи постоянно улучшаемого алгоритма с привлечением лучших покерных умов, которые могут быстро определить, играл ли покерист по GTO. Если эти люди приходят к выводу, что GTO-игра имела место, то смотрят на другие факторы, чтобы определить, пользовался ли игрок подсказчиком в реальном времени.

В любом случае, использование подсказчиков в реальном времени плохо не только для заоблачных лимитов. Даже если солверы никогда не использовались в более дешёвых играх (что определённо не так), игроки низких лимитов, думая, что их могут обмануть, могут массово перестать играть.

Последние 15 лет я много общался с офлайн-игроками и слушал их рассказы о полученном опыте игры в интернете. Не меньше сотни из них говорили мне, что стали жертвой обмана в том знаменитом скандале с «суперпользователем» на Ultimate Bet и Absolute Poker. Насколько мне известно, ни один из них на самом деле не был жертвой — они и близко не сыграли в тех румах столько рук, чтобы оказаться за одним столом с «Potripper» или другими «суперпользователями», но они были уверены в этом.

Любой намёк на нарушение общепринятых правил вынуждает рекреационных игроков покидать игру. Они ищут внешнюю причину своих проигрышей и не желают признавать, что попросту не годятся в современных жёстких онлайн-играх, где, помимо соперников, нужно бить ещё и рейк. В своих неудачах они винят чьё-то жульничество, а теперь будут винить солверы. И они перестанут играть, думая, что в этих играх невозможно выиграть, ибо все играют с подсказчиком. Вот в чём главная угроза.

Это подводит нас к вопросу об экосистеме любого покерного сайта. «Рыбы», «акулы» и «океан» — это простые и всем понятные покерные термины.

Когда «рыбу» съедают, это значит, что она чересчур быстро проиграла слишком много денег и недостаточно часто выигрывала. В результате «рыба» перестала играть и ушла из экосистемы. И наоборот, когда руму удаётся привлечь нового игрока, в экосистеме становится на одну «рыбу» больше.

Если каждая «акула» съедает одну «рыбу» в час за каждым столом, а рум способен привлекать такое же число новых игроков, это устойчивая экосистема. Запас потенциальных игроков не бесконечен, но если их приток достаточно большой, экосистема может оставаться устойчивой очень долго.

Однако если каждая «акула» открывает на один стол больше, то «рыба» в руме больше не воспроизводится, и это запускает необратимый процесс. За стол с одной «акулой» и восемью «рыбами» нужно было привлекать всего одну новую «рыбу» в час, но если на место какой-то из «рыб» приходит ещё одна «акула», значит, за этот стол нужно привлекать две новых «рыбы» в час. Вот почему многие покерные сайты начали ограничивать число играемых столов — это не позволяет «акулам» слишком быстро поедать «рыбу» и разрушать экосистему.

Худший сценарий, который, к сожалению, выглядит наиболее вероятным, выглядит так: некоторые «рыбы» начинают использовать солверы и превращаются в очень больших «акул». Ещё какие-то из «рыб» уходят, потому что слышали о солверах и думают, что не смогут выиграть. Экосистема теряет равновесие, и съеденные «рыбы» не успевают замещаться вновь привлечёнными. Концентрация «акул» увеличивается, и ещё больше игроков уходят из рума, потому что начинают быстрее проигрывать свои деньги.

В конце концов, ситуация выходит из-под контроля, всё больше и больше «рыб» оказываются съеденными, а соотношение «акул» и «рыб» быстро растёт в пользу первых. Усиление конкуренции бросает экосистему в штопор. Пул игроков снижается ниже критического уровня, и уровень воспроизводства «рыбы» падает ещё сильнее.

Если вы пытались играть одностоловые турниры в небольшом онлайн покер-руме, то должны знать, насколько важна критическая масса игроков. Если на сайте всего 500 игроков, там не получится запустить даже единственный турнир Sit-n-Go, но если пул игроков составляет несколько тысяч, такие турниры будут доступны круглосуточно. Когда игрок видит, что его любимая игра никогда не собирается, он уходит в другой рум или бросает онлайн-покер.

Неспособность удержать критическую массу игроков тоже будет расти по спирали. SNG-игрок, покинувший рум, также мог играть и крупные МТТ по выходным, и с его уходом пул МТТшников станет меньше. То же может случиться с кэш-играми. Если несколько недель подряд из-за нехватки игроков не будет собираться какая-то игра, на этом сайте она может умереть навсегда.

Солверы могут очень быстро разрушить экосистему онлайн-покера тремя путями: они отпугивают «рыбу», помогают «акулам» быстрее её пожирать и превращают некоторых «рыб» в «акул».

Как покерная индустрия может сдержать угрозу использования подсказчиков в реальном времени, которые дают некоторым игрокам несправедливое преимущество?

Напомню, как работает солвер: вы загружаете в него какую-то раздачу и вводите свои предположения о диапазонах и тенденциях соперника, а он проигрывает её множество раз, чтобы определить оптимальное игровое решение. У этого есть и обратная сторона: качество решений солвера соответствует качеству исходных данных, которые вы ему «скормили», и для того чтобы просто понять логику его решений, нужно быть весьма продвинутым покеристом.

На низких лимитах подсказчики — не такая большая угроза, потому что они заточены на выработку лучших решений против сильных соперников. Кроме того, солверам до сих пор нужна настолько высокая вычислительная мощность, что использовать их в реальном времени практически невозможно.

Но, похоже, что для решения проблемы недостаточной производительности есть обходной путь. Игрока высоких лимитов Федора Крузе обвинили в использовании базы данных, состоящей из тысяч заранее просчитанных раздач. Эта база была достаточно большой для того, чтобы по ходу сессии он мог отыскать в ней решение, релевантное для большинства игровых ситуаций. Вместо того, чтобы использовать подсказчик в реальном времени, он просто обращался к просчитанной базе данных.

Некоторые скажут, что это не форма читерства и ничем не отличается от использования чарта SnapShove или покерной книги во время игры. Но разница в том, что когда игрок пользуется чартом или книгой, предполагается, что он использует их как памятку для вспоминания того, что он уже выучил. Если я прикрепил к монитору листок с диапазоном пуша для стека 10 ББ, значит, я его изучил и понимаю, почему это +EV игра.

Если обвинения в сторону Крузе верны, то разница заключается в том, что он сверялся с информацией, которая до этого не была ему известна. Вместо того чтобы вспоминать изученное, он сразу получал готовый ответ. Возможно, он даже не знал, почему предложенное солвером решение — прибыльное.

Грань между обращением к информации, которую ты уже знаешь, и слепым следованием готовому решению, несомненно, существует, но никто не может сказать, где именно она проходит. Но нам важнее понять следующее: как помешать игрокам сверяться с базами данных, подобными той, в использовании которой обвиняют Крузе? И как остановить использование солверов, когда они станут настолько быстрыми, что их можно будет задействовать в реальном времени?

Безусловно, в покер-румах будут реализованы какие-то меры безопасности. Например, уже сейчас у покериста можно отследить необычную последовательность кликов мышкой во время игры. Крузе, как утверждают, решил эту проблему, используя два компьютера и две мышки. Но чтобы предотвратить мошенничество, покер-румы неизбежно научатся получать всё больше информации с вашего компьютера во время сессии. Возможно, они уже это умеют.

Некоторые предлагают ещё один способ решения проблемы солверов — сделать онлайн-игру больше похожей на живой покер. Например, ввести обязательную игру с веб-камерой, что ещё в 2019 году предложил партнёр partypoker Роб Йонг. Когда-то это могло показаться нелепостью и нарушением неприкосновенности частной жизни, но такая идея набирает популярность. Компьютеры уже умеют хорошо распознавать человеческие лица, а рост числа «домашних» онлайн-игр между друзьями лишь подстёгивает к использованию веб-камер, потому что с ними веселее. Сегодня так много онлайн-покеристов стримят на Twitch, что уже не кажется преувеличением то, что когда-нибудь мы все будем это делать.

Лично я намного сильнее склоняюсь к незначительным, но регулярным изменениям форматов покера, чтобы сделать реалтайм-солверы менее полезными. Крузе, как говорят, почти всегда играл со стеком 100 ББ, и в такой глубине его игра была почти идеальной, но в эффективных стеках 30 ББ он совершал простейшие ошибки. Похоже, его обширная база данных была просчитана только для ситуаций, где эффективный стек равен 100 ББ. Если игры регулярно изменять, то игроку, использующему солвер, станет труднее перестраиваться, но умелый покерист, играющий своей головой, легко к этому адаптируется. Например, на этой неделе играем Zoom с глубиной 125 ББ, а на следующей — с глубиной 75 ББ, или на этой неделе играем с анте, а на следующей — со страддлом.

PokerStars получили много критики за свои экспериментальные форматы вроде Fusion, Unfold или Split Hold’em, но я думаю, что они неспроста постоянно что-то изменяют. Хороший игрок легко приспособится к таким играм, потому что освоил их единую основу, но слабый регуляр, машинально использующий солвер, будет вчистую проигрывать. Нетрудно сделать «идеальную базу данных» бесполезной — случайное добавление денег в банк по типу Cash Drops в GGPokerOK, анте, страддлы, изменение размера блайндов и т.д.

Это также сделает игру чуть увлекательнее для рекреационных игроков, которым такое разнообразие будет только в радость. Как пример можно привести формат прогрессивных нокаутов в турнирном покере — он популярен, потому что такие турниры интереснее играть, и в то же время их труднее просчитать.

Не думаю, что солверы станут концом для турнирного покера, если индустрия будет относиться к этой проблеме достаточно серьёзно, что уже происходит. Но поскольку будет трудно помешать людям просчитывать игру в реальном времени, я предлагаю сделать её более трудной для просчёта.

Развивая тему, поднятую в предыдущем пункте, перейдём к конкретике. Так какие же форматы покера труднее, а какие проще просчитать с помощью солвера? И от чего это зависит?

Выше я предположил, что эффективная борьба с реалтайм-солверами должна заключаться не столько в карательных мерах, сколько в постоянном изменении условий самой игры, чтобы её было труднее просчитать. Теперь давайте затронем эту тему чуть глубже и поговорим о том, какие факторы делают игру более, а какие менее «просчитываемой».

Некоторые форматы вроде лимитированного холдема хедс-ап просчитаны на 100%, в то время как другие, например, нокаут-турниры по пот-лимитной омахе хай-лоу, вполне возможно, никогда не будут просчитаны. Так какие же факторы влияют на «просчитываемость»?

По состоянию на осень 2020 года почти все просчитанные решения в покере относятся к хедс-ап банкам. Хотя в безлимитном холдеме раздачи отличаются бо́льшим числом возможных сценариев из-за бетсайзинга, игроки в своих действиях ограничены только коллом, фолдом, ставкой и чеком. Если перед вами уже поставили, дерево решений сужается до трёх вариантов — колл, фолд или рейз. Добавьте в раздачу третьего игрока, и у дерева станет шесть потенциальных ответвлений, и так далее.

Таким образом, формат покера, который поощряет образование мультибанков, труднее просчитать. На практике это часто означает форматы, в которых эквити рук близки друг к другу: турниры с прогрессивными нокаутами, пот-лимитная омаха, игры с разделом банка, игры с анте и так далее. Кроме того, такие дисциплины более увлекательны для рекреационных игроков.

Чем лузовее игра, тем труднее её просчитать. Чтобы это понять, не нужно быть экспертом в GTO-софте: просто задумайтесь о том, насколько простым становится покер, когда у вас тайтовые оппоненты. Когда игрок, не участвовавший в банках последние два часа, вдруг переставляет игрока, открывшегося рейзом с UTG, у него обычно можно предположить A-K и пары от J-J и старше. На любых типах флопа вам будет проще против него играть.

Но когда у игроков может быть что угодно на любом типе флопа, нужно провести больше симуляций, чтобы выработать правильное решение. Нужно учитывать такие факторы, как способность диапазонов подходить разным бордам, дробление диапазонов, их баланс и другие подобные вещи.

Вот почему пот-лимитную омаху ещё нескоро просчитают: там у игроков может быть всё что угодно, по крайней мере, из числа рук, которые хоть как-то подходят борду. Такие вещи, как страддл, анте, случайное добавление денег в банк или награда за выбивание соперника из турнира, подталкивают игроков расширять свои диапазоны, и игру становится труднее просчитать.

Лимитированный холдем несколько лет назад полностью просчитали, потому что структура ставок в этой дисциплине фиксированная, а число возможных решений ограничено. Для этой игры солверам было не так уж трудно создать дерево решений со всеми возможными линиями, а затем выбрать из них лучшую.

Однако в безлимитном холдеме число возможных сценариев почти бесконечно. Играя полным стеком, вы в любой момент можете поставить 1 ББ, 100 ББ или любую промежуточную сумму фишек (а в интернете величина ставки может даже быть кратна доле большого блайнда). В процессе работы с солвером вы вводите наиболее вероятные размеры ставок, которые, по вашему мнению, будет использовать противник, и отсекаете все остальные. До тех пор пока солверы не научились просчитывать каждый возможный бетсайзинг, их решения хороши настолько, насколько точны ваши допущения.

Чем больше вариантов действий, тем больше места для ошибок, поэтому лимитированный холдем всегда будет легче просчитать, чем безлимитный. Точно так же решения для эффективного стека 30 ББ всегда будет легче просчитать, чем решения для эффективного стека 250 ББ.

Таким же образом и другие факторы, влияющие на ваши игровые решения, делают игру более сложной и более трудной для просчёта. PLO8 труднее просчитать, чем безлимитный холдем из-за элемента делёжки банка. Турниры труднее просчитать, чем кэш-игры из-за переменной ценности фишек, которая описывается концепцией ICM, тогда как в кэше ценность фишек всегда одинакова. Например, часто бывает так, что в одной и той же ситуации нужно делать колл на первом уровне турнира и выкидывать на баббле, но в кэш-игре колл всегда останется коллом независимо от того, на каком лимите и против кого именно вы играете.

Внедрение в игру новых элементов — например, анте или Splash The Pot в RIO Poker — тоже делает её труднее для просчёта. Когда в банке появляются дополнительные фишки, диапазоны соответственно изменяются. А ещё есть такие нюансы, как показ сброшенных карт в экспериментальной дисциплине Unfold на PokerStars или два флопа в Split Hold’em.

Отличный пример введения нового элемента, мешающего легко просчитывать игру, это турниры с прогрессивными нокаутами. МТТ и так трудно поддаются просчёту из-за ICM, но добавление возрастающей награды за голову каждого игрока потенциально делает этот формат в принципе непросчитываемым.

Например, Барри Картер и Дара О'Кирни в процессе написания книги по стратегии нокаут-турниров проводили расчёты в программе Holdem Resources Calculator, но вычисления оказались настолько ресурсоёмкими, что эта программа несколько раз слетала. Даже такая простая задача, как определение диапазонов открытия, может стать невероятно сложной, когда в уравнение нужно включить ICM, баунти и разные размеры стеков.

Многие люди воротят нос от новых форматов, будь то разновидности турниров или кэша, но это неправильное отношение. Хороший игрок с прочным знанием основ покера должен смотреть на любой новый формат как на возможность получить больший перевес в мастерстве над соперниками, которые изучали базовую дисциплину по чартам и простым рецептам.

Что особенно обнадёживает, так это то, что многие факторы, благодаря которым игру становится труднее просчитать — широкие диапазоны, больше дополнительных элементов, банки, в которых участвует половина стола, — также делают её более увлекательной для казуальных игроков, что положительно сказывается на экологии онлайн-покера.

Источник: PekarStas

Подписаться на новые публикации автора

Комментарии (0)

Пожалуйста, авторизуйтесь для того, чтобы комментировать