L’IA Gemini 2.5 Pro “termine Pokémon Blue” : l’exploit hallucinant qui bluffe les gamers

Voir Ne plus voir le sommaire

Pour la première fois dans l’histoire de l’intelligence artificielle, l’un de ses modèles les plus puissants, Gemini 2.5 Pro de Google, a réussi à terminer Pokémon Blue, le célèbre jeu sorti en 1996. Une victoire technique célébrée sur le réseau X par Sundar Pichai, PDG de Google, et saluée dans toute la techosphère.

Une IA qui termine Pokémon Blue sans aide humaine directe

C’est sur le réseau social X que Sundar Pichai a annoncé l’exploit de Gemini 2.5 Pro, en déclarant : “Quel final ! Gemini 2.5 Pro vient de compléter Pokémon Blue !” Un message qui a rapidement fait le tour du web, tant l’événement est symbolique : pour la première fois, une intelligence artificielle grand public termine un jeu emblématique sans assistance humaine étape par étape. Ce succès marque une nouvelle étape dans l’évolution des capacités multitâches des LLMs (modèles de langage de grande taille).

Même si Google n’a pas officiellement lancé ce projet en interne, plusieurs cadres de l’entreprise ont soutenu ses résultats. Logan Kilpatrick, chef de produit pour Google AI Studio, a commenté en soulignant les progrès de l’intelligence artificielle dans sa quête des badges Pokémon — une référence aux étapes-clefs du jeu qui ponctuent l’avancée du joueur.

Gemini joue au Pokémon Blue À lire Vous rêves d’avoir la Master Sword de Zelda en vrai ? Elle est enfin disponible

Un projet indépendant mené par Joel Z

Ironie du sort, le projet “Gemini Plays Pokémon” n’a pas été créé par Google mais par Joel Z, un développeur logiciel indépendant âgé de 30 ans. Ce dernier a conçu le système qui permet à Gemini de jouer de manière semi-autonome au jeu culte de Nintendo. Bien que l’initiative soit inédite, Joel Z insiste : son projet est encore en développement, et il ne doit pas être considéré comme une comparaison stricte entre intelligences artificielles.

Il précise également qu’il n’a jamais fourni d’indices directs, ni de solutions détaillées au modèle de Google. À l’exception d’un seul bug lié à l’acquisition d’un objet nécessaire à la progression, aucune intervention humaine n’a affecté les décisions importantes prises par l’IA. L’objectif reste de mesurer la capacité de l’agent à raisonner à partir d’images et d’interface.

Des “agent harnesses” pour aider les IA à comprendre le jeu

Malgré cet exploit, il convient de préciser que Gemini ne joue pas de manière totalement autonome. Comme d’autres projets similaires, il utilise des systèmes d’assistance appelés “agent harnesses”, qui lui fournissent des captures d’écran du jeu enrichies d’annotations. L’IA analyse alors ces données et détermine quelle action entreprendre dans le jeu.

Ces décisions peuvent inclure :

  • La sélection d’une capacité ou d’un objet
  • L’interaction avec un personnage non-joueur (PNJ)
  • L’appel à un module spécialisé pour résoudre une situation complexe

Ensuite, le système simule l’appui sur les boutons, comme si une vraie manette était utilisée. C’est donc une interaction entre interface automatisée et prise de décision contextuelle, qui donne à cette intelligence artificielle une autonomie tactique dans un cadre technique encadré. À lire GTA 6 face à GTA 5 : pourquoi la fameuse piscine « ne prouve rien » selon les fans

Claude n’est pas encore au niveau de Gemini

Le projet s’inscrit dans une dynamique concurrentielle entre laboratoires d’IA. En février dernier, Anthropic avait déjà expérimenté un test similaire avec Claude, son propre modèle de langage, sur une autre version du jeu, Pokémon Red. Toutefois, Claude n’est pas encore parvenu à terminer le jeu, en raison probablement de différences technologiques mais aussi d’environnement logiciel.

Les deux IA n’ayant pas accès au même type de données ni au même cadre d’exécution, Joel Z insiste sur le fait que les comparaisons entre Claude et Gemini ne sont pas pertinentes. La forme de challenge n’est donc pas une compétition officielle mais bien une démonstration technique des capacités cognitives des IA modernes.

Une démonstration symbolique pour l’avenir de l’IA

Même si cela peut sembler anecdotique pour certains, réussir à terminer un jeu comme Pokémon Blue, qui repose sur des dizaines d’heures de stratégie, de navigation, de gestion et d’interactions complexes, représente une avancée capitale. L’agent apprend à comprendre les mécaniques du jeu à partir d’images, de menus, de bulles de texte, et décide quelles actions prendre sans instruction directe.

Ce type de projet pourrait ouvrir la voie à des IA capables de :

  • Naviguer dans des interfaces inconnues
  • Résoudre des problèmes longs avec mémoire et anticipation
  • Gérer des plans à long terme dans des environnements semi-ouverts

Ce que démontre Gemini 2.5 Pro ici, c’est une capacité à appliquer ses raisonnements à des contextes non textuels, ce qui est crucial pour de nombreuses applications futures, que ce soit dans les jeux ou au-delà.

Accueil / Actualités / L’IA Gemini 2.5 Pro “termine Pokémon Blue” : l’exploit hallucinant qui bluffe les gamers