Cepheus, el mejor jugador de poker es un programa

Hace unos meses, un grupo de investigadores de la Universidad de Alberta (Canadá) consiguieron desarrollar un algoritmo capaz de desarrollar una estrategia para conseguir un juego perfecto en la modalidad Heads-up de Poker Texas Hold'em.

El Poker Texas Hold'em está catalogado por la Teoría de Juegos como un juego con información imperfecta. Esto es, no es posible conocer los movimientos próximos o decisiones que un oponente puede realizar, y por tanto no se puede decidir la mejor jugada a realizar en consecuencia a un movimiento del oponente (por ejemplo, en oposición, el ajedrez es un juego con información perfecta, ya que siempre se puede saber el conjunto de movimientos que puede realizar un oponente y actuar en consecuencia).

Por esta razón, es imposible desarrollar un algoritmo que pueda resolver el juego sin ayuda del conocimiento. Pues bién, esto es exactamente lo que es Cepheus, un programa que aprende de cada partida que juega, y utiliza la información almacenada para decidir su siguiente movimiento.

Potencia Computacional

Para los que os guste el poker a un nivel amateur y hayais estudiado la estrategia básica del juego, sabreis que la única manera que hay de convertirse en un buen jugador es sabiendo como reaccionar a los distintos tipos de juego que pueden emplear nuestros oponentes, o lo que es lo mismo, almacenando información sobre jugadas y tipos de jugadores a los que ya nos hemos enfrentado.

Cepheus aplica la potencia computacional a este hecho: Un jugador de poker con una gran memoria, puede almacenar cientos, e incluso miles (llevándolo un poco al límite) de manos a lo largo de su vida mientras que Cepheus es capaz de almacenar del orden de 6000 manos por segundo. Segun los creadores, el entrenamiento básico de Cepheus incluyó mas partidas de las que el ser humano ha jugado en toda la historia.

Su base de datos tiene un tamaño del orden de cientos de terabytes, y una estrategia precomputada de 12 terabytes. El programa fué entrenado durante 2 meses con mas de 4000 CPUs simulando mas de 6.000.000.000.000 (6 billones) de manos por segundo.

Cepheus no pierde

El algoritmo que utiliza, bautizado CFR+, tiene unas premisas bastante sencillas: Cepheus comienza utilizando jugadas aleatorias, y a partir de ahí, halla un parametro denominado arrepentimiento. Esto es, si ve que el resultado de la jugada no ha proporcionado beneficios, va probando distintos movimientos (pasar, subir más, retirarse...) y asignando nuevos niveles de arrepentimiento.

Por supuesto, esto no quiere decir que gane todas las manos, sino que sigue la misma filosofía que todo profesional del juego: A la larga y obviando la varianza, siempre va a obtener beneficios. En la primera mano, se le puede ganar con relativa facilidad, pero, no nos confiemos, Cepheus nos está analizando, y en las manos posteriores, concretamente en las que Cepheus es Dealer, tiene cerca de un elevadisimo porcentaje de efectividad a la hora de ganarnos.

Aplicaciones en otros campos

Como todos imaginareis, la tecnología usada por Cepheus puede ser utilizada en muchos campos en los que se trabaje con información imperfecta, como pueden ser las finanzas o los problemas de diagnóstico. Por ejemplo, una utilidad muy interesante podría ser el diagnóstico médico, aunque en este caso no podría aprender a la velocidad con la que aprende a jugar al poker (no es racional sacrificar a miles de personas por diagnósticos aleatorios fallidos), pero con alguna modificación en el aprendizaje, podría ser un gran proyecto de futuro.

Igualmente, en campos como las finanzas podría ser de gran utilidad y aplicarse a los algoritmos de las transacciones de alta frecuencia, o en la ciberseguridad podría emplearse para resolver problemas inconcebibles hasta ahora.

¿Quieres perder contra Cepheus? Puedes probarlo en http://poker-play.srv.ualberta.ca/
COMPARTE ESTA NOTICIA

COMPARTIR EN FACEBOOK
COMPARTIR EN TWITTER
COMPARTIR EN LINKEDIN
COMPARTIR EN WHATSAPP
SIGUIENTE NOTICIA