- Le sonnet Claude 3.7 d'Anthropic a été testé en jouant à Pokémon Red sur Twitch.
- Le modèle d’IA a démontré des progrès significatifs dans le raisonnement et la prise de décision.
- Il a réussi à vaincre les trois premiers champions de gymnase du jeu, ce que les versions précédentes n'ont pas réussi à réaliser.
- Anthropic met en évidence l’utilisation des jeux vidéo comme méthode d’évaluation de l’intelligence artificielle.
Anthropic a surpris le monde de l'intelligence artificielle en démontrant jusqu'où son nouveau modèle Claude 3.7 Sonnet peut aller dans des tâches complexes. A cette occasion, et dans le cadre d'un test de capacités innovant, Le système d'IA a été mis en place pour jouer à Pokémon Rouge dans Twitch, où les téléspectateurs ont pu suivre l'évolution des travaux en direct.
L'expérience vise à montrer comment l'intelligence artificielle peut prendre des décisions stratégiques et apprendre à naviguer dans un environnement dynamique sans intervention humaine. Cela marque une étape importante par rapport aux versions précédentes du modèle, qui n'avaient pas réussi à surmonter les premières barrières du jeu.
Claude 3.7 Sonnet démontre des progrès dans le raisonnement

Pour évaluer les améliorations apportées au modèle d'IA, Anthropic lui a fourni certains outils clés : Affichage des pixels d'entrée, de la mémoire de base et du contrôle des boutons. Grâce à ces éléments, Claude a pu interpréter ce qui se passait dans le jeu et prendre des décisions en fonction de sa logique interne.
Dans les modèles précédents, comme le Claude 3.0 Sonnet, l'intelligence artificielle Il n'a même pas réussi à quitter la maison du personnage principal.. Cependant, dans cette nouvelle itération, le système a considérablement progressé, parvenant à battre Brock, Misty et le lieutenant Surge, les trois premiers leaders de gymnase du jeu.
Un voyage de 35.000 XNUMX actions dans le monde Pokémon

Le voyage de Claude dans Pokémon Rouge n'a pas été facile. Selon les données fournies par Anthropic, l'IA a exécuté environ 35.000 actions jusqu'à réussir à surmonter l'étape de Ciudad Carmín. Le temps exact que ce processus a pris n'a pas été précisé, mais la capacité du modèle à s'adapter aux changements et apprendre des modèles pendant leur prestation.
L’utilisation des jeux vidéo pour évaluer l’intelligence artificielle n’est pas nouvelle. Cependant, cette expérience renforce l’idée que Ces environnements peuvent devenir des outils fondamentaux pour mesurer les progrès des modèles d’IA capables de raisonner et de s’adapter.
Au-delà du jeu : Claude 3.7 Sonnet et ses applications concrètes

En plus de démontrer des compétences dans Pokémon Rouge, Anthropic a souligné que son modèle d'IA est capable de résoudre des problèmes complexes dans des domaines tels que les mathématiques, la programmation et le codage. Dans le cadre de ses améliorations, une fonctionnalité appelée Claude Code a été ajoutée, qui permet à l'IA de rechercher et de modifier du code, d'exécuter des tests et même de travailler avec des outils comme GitHub.
Pour ceux qui souhaitent tester les capacités du modèle, Claude 3.7 Sonnet est désormais disponible sur diverses plateformes, notamment L'application de Claude, Anthropic API, Amazon Bedrock et Google Cloud, conservant le même coût d’accès que sa version précédente.
Le fait que Claude 3.7 Sonnet ait réussi à surmonter des étapes clés dans Pokémon Rouge renforce l'idée que L'intelligence artificielle progresse à pas de géant en termes de raisonnement et d'apprentissage. Ce type de test ouvre la porte à De nouvelles applications concrètes, de l’automatisation des tâches à la résolution de problèmes complexes sans intervention humaine.
Je suis un passionné de technologie qui a fait de ses intérêts de « geek » un métier. J'ai passé plus de 10 ans de ma vie à utiliser des technologies de pointe et à bricoler toutes sortes de programmes par pure curiosité. Aujourd'hui, je me spécialise dans l'informatique et les jeux vidéo. En effet, depuis plus de 5 ans, j'écris pour différents sites Web sur la technologie et les jeux vidéo, créant des articles qui cherchent à vous donner les informations dont vous avez besoin dans un langage compréhensible par tous.
Si vous avez des questions, mes connaissances s'étendent de tout ce qui concerne le système d'exploitation Windows ainsi qu'Android pour les téléphones mobiles. Et mon engagement est envers vous, je suis toujours prêt à consacrer quelques minutes et à vous aider à résoudre toutes les questions que vous pourriez avoir dans ce monde Internet.