Un an après le jeu de Go, c’est maintenant le célèbre jeu de carte qui a été conquis par la machine. Avec des implications possibles incroyables.


C’est un nouveau coup dur pour l’espèce humaine. Lundi 30 janvier, un programme informatique nommé Libratus s’est imposé face à quatre joueurs professionnels de poker dans un tournoi qui a duré près de 20 jours.

Après avoir joué plus de 120.000 mains au global, Libratus, développé par des chercheurs de l’université américaine de Carnegie Mellon, a accumulé 1.766.250 dollars (virtuels, évidemment). Chaque joueur, parmi les meilleurs au monde, affrontait la machine dans un face à face selon les règles du « Texas Hold’em no limit », la version la plus courante du poker.

Le joueur qui a le moins perdu d’argent dans son duel, Dong Kim, est tout de même en déficit de plus de 85.000 dollars. Les parties étaient retransmises en direct sur la plateforme Twitch. Une victoire nette et sans bavure, qui marque une nouvelle étape dans le développement de l’intelligence artificielle.

Après la victoire aux échecs de DeepBlue en 1996, celle d’AlphaGo au jeu de Go en mars 2016, c’est maintenant au poker que les machines s’en prennent. Alors même que l’on pensait il y a encore quelques mois que les ordinateurs n’étaient pas prêts de battre les humains à ce jeu.

Le poker, un défi pour les machines

Il faut dire que le poker est un jeu assez particulier. À l’inverse des classiques jeux de plateaux, les informations ne sont pas complètes. On ne sait pas ce que le joueur adverse a dans ses mains. De plus, dans cette variante « no limit », la plus connue, il est possible de miser autant d’argent que l’on veut. De quoi compliquer effroyablement l’équation pour la machine.

Ce n’est pas la première fois que les chercheurs essayent de battre les joueurs de poker professionnels, évidemment. « En 2015, nous avons joué contre les meilleurs humains et n’avons pas réussi à les battre », précise au HuffPost Tuomas Sandholm, qui a dirigé ces recherches.

Entre temps, les chercheurs ont amélioré leur programme. Celui-ci a joué de nombreuses parties contre lui-même et a appris de celles-ci, précisent les auteurs sur Reddit. Libratus n’a, au départ, pas utilisé un historique de parties humaines pour s’améliorer, à l’inverse d’AlphaGo.

À l’intérieur de ce programme, plusieurs algorithmes qui vont élaborer des stratégies en fonction des cartes distribuées, d’autres qui vont essayer de comprendre les actions et les erreurs des adversaires, afin de décider s’il est nécessaire de bluffer et quand, par exemple, précise le site Inc.

De plus, chaque soir, après avoir joué contre les joueurs humains, le programme continuait à s’entraîner avec ces nouvelles données en utilisant un superordinateur. Pour l’instant donc, peu de risque de voir ce genre de programme se répandre sur les sites de jeux en ligne. Mais à terme, les joueurs professionnels qui ont été confrontés estiment que ces programmes risquent de totalement détruire le poker en ligne à deux joueurs.

Finance, militaire, santé… le futur des possibles

L’intérêt de ces algorithmes, c’est qu’ils ne sont pas dédiés exclusivement au poker. Ils pourraient être utilisés dans de nombreuses situations où une décision doit être prise sans avoir connaissance de tous les éléments, affirment les auteurs.

« Le fait de maîtriser ces jeux à information incomplète est intéressant, car cela préfigure des situations courantes », abonde Jean-Gabriel Ganascia, chercheur au CNRS spécialisé dans l’intelligence artificielle interrogé par Le HuffPost.

L’université de Carnegie Mellon estime ainsi que ce type de programmes pourrait être utilisé pour « négocier des accords commerciaux, mettre en place des stratégies militaires ou planifier un traitement médical ».

En attendant ces applications concrètes, reste-t-il encore des jeux où l’homme est bien meilleur que la machine? « C’est une avancée certaine, on s’y attendait, mais peut-être pas si tôt », analyse pour Le HuffPost Tristan Cazenave, chercheur au CNRS spécialisé dans les algorithmes liés au jeu. « Il faut tout de même rappeler que c’est du poker à deux joueurs. À plusieurs, c’est beaucoup plus difficile », nuance-t-il.

Enfin, le dernier bastion des joueurs humains se situe, paradoxalement, dans les ordinateurs. « Dans les jeux vidéo, notamment ceux de stratégie en temps réel, il y a des informations incomplètes et surtout énormément d’actions possibles », détaille le chercheur. Reste à savoir combien de temps l’humain sera supérieur à l’intelligence artificielle dans ce domaine. Justement, DeepMind, la société rachetée par Google qui a battu le champion du monde de Go, vient de se mettre à Starcraft 2.


Source : huffingtonpost / numeramasciencesetavenir

Publicités

Laisser un commentaire