Claude, AI de Anthropic, xoga Pokémon en Twitch e sorprende coa súa habilidade de razoar

Última actualización: 28/02/2025

  • Claude 3.7 Sonnet de Anthropic probouse xogando a Pokémon Red en Twitch.
  • O modelo de IA demostrou un progreso significativo no razoamento e na toma de decisións.
  • Conseguiu derrotar aos tres primeiros Gym Leaders do xogo, algo que as versións anteriores non lograron.
  • Anthropic destaca o uso dos videoxogos como método de avaliación da intelixencia artificial.
O momento máis crítico de Claude Ai en Pokémon

Anthropic sorprendeu ao mundo da intelixencia artificial demostrando ata onde pode chegar o seu novo modelo Claude 3.7 Sonnet en tarefas complexas. Nesta ocasión, e como parte dunha innovadora proba de capacidades, O sistema de IA púxose para xogar a Pokémon Red Twitch, onde os espectadores puideron seguir o progreso en directo.

O experimento busca mostrar como pode a intelixencia artificial tomar decisións estratéxicas e aprender a navegar nun ambiente dinámico sen intervención humana. Isto marca un fito en comparación coas versións anteriores do modelo, que non lograran superar as primeiras barreiras dentro do xogo.

Contido exclusivo - Fai clic aquí  Guía completa para usar Google Veo 3: métodos, requisitos e consellos 2025

Claude 3.7 Soneto demostra avances no razoamento

Claude 3.7 Soneto

Para avaliar as melloras do modelo de IA, Anthropic proporcionoulle certas ferramentas clave: Mostrar entrada de píxeles, memoria básica e control de botóns. Grazas a estes elementos, Claude puido interpretar o que pasaba no xogo e tomar decisións en función da súa lóxica interna.

En modelos anteriores, como o Soneto Claude 3.0, a intelixencia artificial Nin sequera conseguiu saír da casa do personaxe principal.. Non obstante, nesta nova iteración, o sistema avanzou considerablemente, logrando vencer a Brock, Misty e o tenente Surge, os tres primeiros líderes do ximnasio do xogo.

Unha viaxe de 35.000 accións dentro do mundo Pokémon

Claude AI xoga Pokémon

A viaxe de Claude en Pokémon Red non foi fácil. Segundo os datos proporcionados por Anthropic, a AI executou preto de 35.000 accións ata conseguir superar a etapa de Ciudad Carmín. Non se especificou o tempo exacto que levou este proceso, pero a capacidade do modelo adaptarse aos cambios e aprender patróns durante a súa actuación.

Contido exclusivo - Fai clic aquí  Google Scholar Labs: Así funciona a nova busca académica con IA

Usar videoxogos para avaliar a intelixencia artificial non é novo. Non obstante, este experimento reforza a idea de que Estes ambientes poden converterse en ferramentas fundamentais para medir o progreso en modelos de IA capaces de razoar e adaptarse.

Máis aló do xogo: Claude 3.7 Sonnet e as súas aplicacións no mundo real

Anthropic presenta Claude 3.7 Soneto-2

Ademais de demostrar habilidades dentro de Pokémon Red, Anthropic destacou que o seu modelo de IA é capaz resolver problemas complexos en campos como matemáticas, programación e codificación. Como parte das súas melloras, engadiuse unha función chamada Claude Code, que permite á IA buscar e editar código, realizar probas e mesmo traballar con ferramentas como GitHub.

Para aqueles interesados ​​en probar as capacidades do modelo, Claude 3.7 Sonnet xa está dispoñible nunha variedade de plataformas, incluíndo A aplicación de Claude, Anthropic API, Amazon Bedrock e Google Cloud, mantendo o mesmo custo de acceso que a súa versión anterior.

Claude 3.7 Soneto
Artigo relacionado:
Anthropic presenta Claude 3.7 Sonnet: IA híbrida con razoamento avanzado

O feito de que Claude 3.7 Sonnet conseguise superar etapas clave dentro de Pokémon Red reforza a idea de que A intelixencia artificial avanza a pasos axigantados en termos de razoamento e aprendizaxe. Este tipo de probas abre a porta Novas aplicacións do mundo real, desde a automatización de tarefas ata a resolución de problemas complexos sen intervención humana.

Contido exclusivo - Fai clic aquí  Como coñecer o meu coeficiente intelectual co tonómetro?