La IA Claude d'Anthropic juga Pokémon a Twitch i sorprèn amb la seva capacitat de raonament

Darrera actualització: 28/02/2025

  • Claude 3.7 Sonnet d'Anthropic ha estat provat jugant a Pokémon Rojo a Twitch.
  • El model d'IA ha demostrat un avenç significatiu en el raonament i la presa de decisions.
  • Va aconseguir derrotar els tres primers líders de gimnàs del joc, cosa que versions anteriors no van aconseguir.
  • Anthropic destaca l'ús de videojocs com a mètode d'avaluació per a la intel·ligència artificial.
El moment més crític de Claude Ai en pokémon

Anthropic ha sorprès el món de la intel·ligència artificial en demostrar fins on pot arribar el seu nou model Claude 3.7 Sonnet en tasques complexes. En aquesta ocasió, i com a part d'una innovadora prova de capacitats, el sistema d'IA va ser posat a jugar a Pokémon Rojo a Twitch, on els espectadors van poder seguir en directe els seus avenços.

L'experiment cerca mostrar com la intel·ligència artificial pot prendre decisions estratègiques i aprendre a desenvolupar-se en un entorn dinàmic sense intervenció humana. Això marca una fita respecte a versions anteriors del model, que no havien aconseguit superar barreres primerenques dins del joc.

Contingut exclusiu - Clic Aquí  Guia Completa Per Usar Google Veig 3: Mètodes, Requisits i Consells 2025

Claude 3.7 Sonnet demostra avenços en raonament

Claude 3.7 Sonet

Per avaluar les millores al model d'IA, Anthropic li va proporcionar certes eines clau: entrada de píxels de la pantalla, memòria bàsica i control de botons. Gràcies a aquests elements, Claude va poder interpretar el que passava en el joc i prendre decisions basades en la seva lògica interna.

En models anteriors, com Claude 3.0 Sonnet, la intel·ligència artificial ni tan sols va aconseguir sortir de la casa del personatge principal. No obstant això, en aquesta nova iteració, el sistema va avançar considerablement, aconseguint vèncer Brock, Misty i Lt. Sorgeix, els tres primers líders de gimnàs del joc.

Un recorregut de 35.000 accions dins del món Pokémon

Claude AI juga Pokémon

El recorregut de Claude a Pokémon Rojo no va ser senzill. Segons les dades proporcionades per Anthropic, la IA va executar al voltant de 35.000 accions fins a superar l'etapa de Ciudad Carmín. No es va especificar el temps exacte que aquest procés va prendre, però es destaca la capacitat del model per adaptar-se a canvis i aprendre patrons durant el rendiment.

Contingut exclusiu - Clic Aquí  Google Scholar Labs: així funciona la nova cerca acadèmica amb IA

L'ús de videojocs per avaluar la intel·ligència artificial no és nou. Tot i això, aquest experiment reforça la idea que aquests entorns es poden convertir en eines fonamentals per mesurar avenços en models de IA capaços de raonar i adaptar-se.

Més enllà del joc: Claude 3.7 Sonnet i les seves aplicacions reals

Anthropic presenta Claude 3.7 Sonnet-2

A més de demostrar habilitats dins de Pokémon Rojo, Anthropic ha destacat que el seu model d'IA és capaç de resoldre problemes complexos en àmbits com les matemàtiques, la programació i la codificació. Com a part de les seves millores, s'hi ha afegit una funció anomenada Claude Code, que permet a la IA buscar i editar codi, executar proves i fins i tot treballar amb eines com GitHub.

Per a aquells interessats a provar les capacitats del model, Claude 3.7 Sonnet ja està disponible en diverses plataformes, incloent-hi l'app de Claude, l'API d'Anthropic, Amazon Bedrock i Google Cloud, mantenint el mateix cost d'accés que la versió anterior.

Claude 3.7 Sonet
Article relacionat:
Anthropic presenta Claude 3.7 Sonnet: IA híbrida amb raonament avançat

El fet que Claude 3.7 Sonnet hagi aconseguit superar etapes clau dins de Pokémon Rojo reforça la idea que les intel·ligències artificials estan avançant a passos de gegant en termes de raonament i aprenentatge. Aquest tipus de proves obren la porta a noves aplicacions al món real, des de l'automatització de tasques fins a la resolució de problemes complexos sense intervenció humana.

Contingut exclusiu - Clic Aquí  Com saber el meu coeficient intel·lectual amb Tontòmetre?