L’intelligence artificielle devient championne d’e-sport sur StarCraft II

Image légendée — AlphaStar (en vert) remporte la victoire lors d'une rencontre finale © Deepmind

Sur les champs de bataille virtuels du jeu de stratégie StarCraft II, un nouveau venu sème le trouble. Ce joueur anonyme sur les serveurs est parvenu à se hisser au rang ultime de Grandmaster, et à se classer dans les 0,2 % des meilleurs joueurs mondiaux.

Son nom ? AlphaStar. Sa particularité ? Aucun humain derrière le clavier.

Cette intelligence artificielle (IA) est le dernier coup d’éclat de l’équipe anglaise de DeepMind, entreprise appartenant au groupe Google. On leur devait déjà AlphaGo et AlphaZero, logiciels dont les performances dépassent celles de l’homme aux jeux de Go, d’échecs et de shōgi, un jeu traditionnel japonais proche des échecs. Avec AlphaStar, présenté dans le journal Nature du 30 octobre, c’est à un nouveau défi de l’intelligence artificielle que les chercheurs s’attaquent.

Sorti en 2010, Starcraft II est un jeu vidéo de stratégie en temps réel édité par Blizzard Entertainment. Si les stratégies de jeu sont complexes, le but est simple : récupérer des matières premières, se constituer une armée, battre son adversaire. Regroupant une communauté de plusieurs millions de joueurs à travers le monde, Starcraft II constitue l’un des e-sports les plus pérennes de l’histoire.

Le développement d’une IA appliquée à ce jeu représente un véritable défi pour plusieurs raisons. D'abord, Starcraft II se joue en temps réel, et non au tour par tour comme aux échecs. Les actions des deux joueurs se déroulent de manière simultanée, et à large échelle. Avec des centaines d’unités et d’infrastructures gérées simultanément, chaque action ouvre un large et complexe champ de possibilités.

Ensuite, l’information est incomplète. Contrairement au jeu de Go, le joueur n’a accès qu’à une partie de la carte de jeu. Il doit ainsi l’explorer de manière active, en permanence, pour ne pas passer à côté d’informations cruciales.

De plus, les relations de cause-à-effet ne sont pas immédiates. Chaque action peut avoir des conséquences à long-terme, et une partie peut s’étendre sur plus d’une heure de jeu.

Enfin, à l’image d’un jeu comme pierre, feuille, ciseaux, il n’y a pas une seule meilleure stratégie. Et c’est sur ce point que l’algorithme d’AlphaStar se distingue de celui des autres IA. En utilisant un apprentissage par renforcement multi-agent, le logiciel parvient à diversifier ses stratégies et à appréhender le jeu dans sa globalité.

Une vidéo promotionnelle du jeu Starcraft II

Une première version de AlphaStar s’était déjà illustrée en janvier dernier en remportant la victoire dans un match retransmis en direct contre deux joueurs professionnels dont Dario « TLO » Wünsch. Ce dernier, également co-auteur de l’article, certifie que le logiciel joue dans les mêmes conditions qu’un adversaire en chair et en os. Une interface caméra et une fréquence d’action bridée assurent ainsi l’équité en ne conférant à la machine aucune « compétence surhumaine » – à l’exception bien sûr de sa résistance au stress, aux crampes, ou à la fatigue.

Aujourd’hui, AlphaStar devient la première IA a obtenir le titre de Grandmaster, en jouant dans des conditions identiques à celles des humains.

Une telle avancée ouvre la voie à des applications en monde réel, dans des environnements complexes et dynamiques impliquant plusieurs acteurs – assistants personnels ou voitures autonomes par exemple.