Os jogos de pôquer estão mudando de forma imprevisível e mais difícil de prever? Como?

Sumário

À medida que o pôquer se tornou mais popular, o mesmo aconteceu com a trapaça. Já imaginou que alguém poderia consertar uma partida de tênis ou criar um software para “correr mal” em um cassino? Michael Bowling, cientista da computação da Universidade de Alberta, mantém um escritório arrumado, ao contrário de muitos de seus colegas, cujos espaços transbordam de detritos tecnológicos. Bowling tem como única bagunça as fórmulas densas e inescrutáveis e os gráficos rabiscados com marcadores tecnicolor em um quadro branco do tamanho da parede. Ele precisa da matemática elaborada porque está tentando dar sentido a um mundo muito complexo: o jogo de pôquer. “Até mesmo a menor variante do pôquer tem um bilhão de bilhões de pontos de decisão”, ele me disse. O Grupo de Pesquisa de Pôquer Computadorizado da universidade foi formado em 1996, após as partidas de xadrez de Garry Kasparov com o Deep Blue da IBM naquele ano. O grupo não está interessado em conquistar o jogo em si. Eles o veem como um campo de testes para fazer boa ciência. A complexidade matemática do pôquer rivaliza com a do xadrez – ou a excede, dependendo da variante – e o pôquer acrescenta aleatoriedade e informações ocultas, aproximando-o do “mundo real” que os pesquisadores de IA tanto querem influenciar. Os pesquisadores do grupo de pôquer não estão interessados em conquistar o jogo em si. Eles o veem como um campo de testes para fazer boa ciência. No entanto, o trabalho deles não foi apenas um exercício acadêmico; ele transformou a forma como os profissionais de pôquer abordam o jogo. Em busca de maneiras de melhorar suas probabilidades, os profissionais começaram a aproveitar o talento do professor Bowling. Bowling. “Sou contatado regularmente por profissionais de pôquer perguntando se posso ajudá-los em alguma coisa. Eu diria que cada um dos 10 melhores profissionais do mundo está pagando um programador de pôquer para fazer alguma coisa”, disse ele. Falaremos mais sobre isso aqui no BRABET.

“Os profissionais ficaram sabendo do que estávamos fazendo”, disse-me Richard Gibson, ex-aluno de doutorado do professor Bowling. A dissertação do Prof. Gibson foi intitulada “Regret Minimization in Games and the Development of Champion Multiplayer Computer Poker-Playing Agents”. O arrependimento é um conceito matemático formalizado quando se trata de tomar decisões em um ambiente incerto – é a diferença entre uma decisão ótima e uma decisão real. Minimizar o arrependimento é um ingrediente importante em muitos algoritmos modernos de jogo de pôquer. “Parecia que valia muito para eles”, disse o Prof. Gibson. “Eles estavam me pagando muito bem.” Os programadores são contratados para analisar os dados do jogo de um jogador, encontrando “vazamentos” ou erros em seu jogo, e para realizar análises teóricas do jogo, calculando quais jogadas são ideais em qualquer uma das inúmeras situações que um jogador de pôquer pode enfrentar. Mesmo um programa de pôquer pronto para uso pode ser bastante caro – a versão profissional de um programa popular custa US$ 475. Mas vale a pena, pois pode mudar radicalmente o jogo de um jogador.

A chave é tornar seu jogo mais imprevisível e, portanto, menos explorável. No jogo infantil de pedra, papel e tesoura, jogar cada jogada aleatoriamente com um terço de chance torna impossível para seu oponente adivinhar seu padrão e vencê-lo. No pôquer, isso pode ser feito com intervalos de mãos e estratégias mistas. Se os outros jogadores souberem, por exemplo, que quando eu tiver o “small blind” – a aposta obrigatória feita no início da mão pelo jogador sentado à esquerda do dealer – só aumentarei US$ 100 quando tiver um par de ases, esse é um fato que pode ser explorado. Em vez disso, os programas aconselham que eu agrupe minhas mãos em intervalos, aumentando US$ 100 quando tiver não apenas ases, mas também, digamos, reis e damas. Além disso, não devo fazer sempre a mesma coisa com a mesma gama de mãos – devo misturar minha estratégia e fazer uma randomização. Talvez dois terços das vezes em que eu tiver um par de ases eu aumente a aposta e um terço das vezes eu faça o call, igualando a última aposta feita. Alguns jogadores de pôquer são conhecidos por usar um relógio de pulso como dispositivo de randomização. Por exemplo, para decidir se aumenta ou paga, basta olhar para a segunda mão: nos primeiros dois terços do minuto você aumenta, no último terço você paga.

Hoje em dia, os jogadores de pôquer chamam esse estilo de jogo de “GTO” – game-theory optimal. Seus praticantes são livres para se esconderem sob capuzes e fones de ouvido grandes, porque se você adotar esses princípios completamente, poderá praticamente ignorar os outros jogadores em sua mesa. Suas identidades e peculiaridades específicas são irrelevantes. Tudo o que importa é que, eventualmente, eles errarão e você lucrará. E é por isso que os jogadores de GTO contratam os programadores, para ajustar esses intervalos e porcentagens, para encontrar e eliminar todas as partes exploráveis de seus jogos.

No verão de 2019, sentei-me com meu laptop em uma tarde ensolarada para jogar no-limit Hold ‘Em contra o DeepStack, um programa que o Prof. Bowling ajudou a desenvolver. Bowling ajudou a desenvolver. O computador e eu começamos com 20.000 fichas cada um, e os blinds, as apostas obrigatórias que iniciam cada mão, começaram com 50 e 100 fichas e aumentaram a cada 10 mãos. Sempre que um jogador ganhava todas as fichas, ele (ou o computador) marcava um ponto e o processo começava novamente. Ao longo de alguns dias, o DeepStack exibiu um estilo de jogo peculiar. Foi ferozmente agressivo no estágio “pré-flop”, quando as únicas cartas que um jogador pode ver são as duas de sua mão particular. Ele aumentava e aumentava novamente no início com praticamente qualquer coisa e, às vezes, lançava apostas all-in iniciais e enormes; quase nunca desistia no small blind. Mas depois do flop, ele se acalmou consideravelmente, como se tivesse tomado um Xanax digital, e jogou o que me pareceu ser um jogo passivo.

Fiz o que pude para explorar o que considerava ser as tendências do programa, mas essa era uma máquina especificamente projetada e treinada para não ser explorada – para obedecer às máximas matemáticas encontradas na teoria dos jogos e às geometrias elementares do jogo. Para minha surpresa, consegui obter algumas vitórias. Parei a partida quando tinha uma vantagem de 15 a 14 jogos. Assim como Kasparov fez depois de jogar contra o Deep Blue pela primeira vez, fiquei olhando para o teto por um longo tempo depois da partida, aliviado por ter vencido a máquina. A sensação não durou muito. Pouco depois da partida, o Prof. Bowling me enviou um e-mail, analisando meu desempenho em relação à sua criação, analisando quais partes do meu sucesso foram resultado da habilidade e quais partes emergiram da espessa névoa de aleatoriedade inerente ao pôquer sem limites. Ele escreveu: “Você deve esperar ganhar 42% (margem de erro de 5%) de suas partidas contra o DeepStack. Embora você tenha vencido 15 e perdido 14, seu jogo (depois de remover a sorte) sugere que você deveria ter vencido 12 partidas e perdido 17.”

Conclusão

Você é um ávido fã de jogos e quer saber como apostar em jogos de cassino on-line? Na BRABET, você obterá as informações mais recentes sobre os melhores jogos de cassino deste ano e uma variedade de opções de jogos, tudo em um só lugar.

Para iniciar sua jornada de apostas on-line, tudo o que você precisa fazer é criar uma conta no site, depositar fundos e estará pronto para apostar nos melhores e mais esperados jogos de cassino.

Perguntas frequentes

Os muitos elementos aleatórios do pôquer são uma grande parte do que torna o jogo tão estrategicamente complexo. Nunca podemos saber com 100% de certeza quais cartas nossos adversários têm, nem quais cartas serão distribuídas no flop, no turn e no river.

A estratégia de pôquer passou por várias mudanças, desde apostas de continuação e aumentos de botão até bloqueadores, small-ball e GTO (Otimização da Teoria dos Jogos). À medida que os jogadores desenvolvem suas próprias estratégias, alguém sempre parece estar pensando um passo à frente.