Póquer Bayesiano: Cómo encontrar distribuciones que no puedes encontrar usando combinatoria

Esta es mi primera pregunta sobre stackoverflow y también la primera vez que implemento una red baysiana, por lo que me disculparé de antemano por cualquier error de novato que cometa.

El objetivo de mi proyecto es implementar un jugador de póquer que haga inferencia baysiana. Un grupo de la Universidad de Monash en Australia, dirigido por Kevin Korb, ha realizado algunos trabajos sobre esto, a los que estoy usando como referencia. Puedes encontrar su trabajo aquí:

La primera referencia, al ser un libro, es más útil y detallada (ver Capítulos 5.5 y 11 para Poker). Estoy usando la versión simplificada de Texas Holdem llamada Leduc Hold'em para empezar.

Leduc Hold'em es un juego de póquer para dos jugadores. La baraja utilizada en Leduc Hold'em contiene seis cartas, dos jotas, dos reinas y dos reyes, y se baraja antes de jugar una mano. Al comienzo de una mano, cada jugador paga un ante de una ficha al bote y recibe una carta privada. Luego se lleva a cabo una ronda de apuestas que comienza con el jugador uno. Después de la ronda de apuestas, se revela una sola carta pública del mazo, que ambos jugadores usan para construir su mano. Esta carta se llama flop. Otra ronda de apuestas ocurre después del flop, nuevamente comenzando con el jugador uno, y luego se lleva a cabo un enfrentamiento. En un showdown, si cualquiera de los jugadores ha emparejado su carta privada con la carta pública, gana todas las fichas del bote. En el caso de que ninguno de los jugadores haga pareja, el jugador con la carta más alta es declarado ganador. Los jugadores se reparten el dinero del bote si tienen la misma carta privada.

Cada ronda de apuestas sigue el mismo formato. El primer jugador en actuar tiene la opción de pasar o apostar. Al apostar, el jugador agrega fichas al bote y la acción pasa al otro jugador. Cuando un jugador se enfrenta a una apuesta, tiene la opción de retirarse, igualar o subir. Al retirarse, un jugador pierde la mano y todo el dinero del bote se otorga al jugador contrario. Al igualar, un jugador coloca suficientes fichas en el bote para igualar la apuesta enfrentada y concluye la ronda de apuestas. Al subir, el jugador debe poner más fichas en el bote que la apuesta actual y la acción pasa al jugador contrario. Si el primer jugador pasa inicialmente, el segundo jugador puede pasar para concluir la ronda de apuestas o apostar. En Leduc Hold'em hay un límite de una apuesta y una subida por ronda. Las apuestas y aumentos son de un tamaño fijo. Este tamaño es de dos fichas en la primera ronda de apuestas y de cuatro fichas en la segunda.

Si observa la página 185, Sección 5.5.2.1 en la Figura 5.14, hay un diagrama para una red bayesiana para póquer. Este es esencialmente el mismo que estoy usando para mi proyecto, pero dado que no hay cartas boca arriba en Leduc Hold'em, los dos nodos correspondientes para cartas boca arriba no son aplicables. Pude calcular las tablas de portabilidad conjunta entre los pares de nodos (BPP_Win, BPP_Fin), (BPP_Win, OPP_Fin), (OPP_Fin, BPP_Fin), (OPP_Fin, OPP_Curr) y (BPP_Fin,BPP_Curr) pero no estoy seguro de cómo calcular la probabilidad conjunta de (OPP_Curr, OPP_Action). Según tengo entendido, es necesario algún tipo de técnica de muestreo.

Como pregunta de seguimiento, si puedo calcular esta probabilidad conjunta, entonces debería poder calcular la probabilidad marginal de BPP_win dada mi tarjeta actual usando BP y tratando las probabilidades conjuntas como factores, ¿correcto?

preguntado el 28 de julio de 12 a las 02:07

¡Hola! Este foro se centra en cuestiones de programación e informática. Si bien parece que está buscando un algoritmo específico, aún puede estar mejor atendido en estadísticas.stackexchange.com -

Ahh, muchas gracias eso es exactamente lo que necesitaba, ¿sabes de otros? -

0 Respuestas

No es la respuesta que estás buscando? Examinar otras preguntas etiquetadas or haz tu propia pregunta.