- Claude 3.7 Sonnet d'Anthropic ha estat provat jugant a Pokémon Rojo a Twitch.
- El model d'IA ha demostrat un avenç significatiu en el raonament i la presa de decisions.
- Va aconseguir derrotar els tres primers líders de gimnàs del joc, cosa que versions anteriors no van aconseguir.
- Anthropic destaca l'ús de videojocs com a mètode d'avaluació per a la intel·ligència artificial.
Anthropic ha sorprès el món de la intel·ligència artificial en demostrar fins on pot arribar el seu nou model Claude 3.7 Sonnet en tasques complexes. En aquesta ocasió, i com a part d'una innovadora prova de capacitats, el sistema d'IA va ser posat a jugar a Pokémon Rojo a Twitch, on els espectadors van poder seguir en directe els seus avenços.
L'experiment cerca mostrar com la intel·ligència artificial pot prendre decisions estratègiques i aprendre a desenvolupar-se en un entorn dinàmic sense intervenció humana. Això marca una fita respecte a versions anteriors del model, que no havien aconseguit superar barreres primerenques dins del joc.
Claude 3.7 Sonnet demostra avenços en raonament

Per avaluar les millores al model d'IA, Anthropic li va proporcionar certes eines clau: entrada de píxels de la pantalla, memòria bàsica i control de botons. Gràcies a aquests elements, Claude va poder interpretar el que passava en el joc i prendre decisions basades en la seva lògica interna.
En models anteriors, com Claude 3.0 Sonnet, la intel·ligència artificial ni tan sols va aconseguir sortir de la casa del personatge principal. No obstant això, en aquesta nova iteració, el sistema va avançar considerablement, aconseguint vèncer Brock, Misty i Lt. Sorgeix, els tres primers líders de gimnàs del joc.
Un recorregut de 35.000 accions dins del món Pokémon

El recorregut de Claude a Pokémon Rojo no va ser senzill. Segons les dades proporcionades per Anthropic, la IA va executar al voltant de 35.000 accions fins a superar l'etapa de Ciudad Carmín. No es va especificar el temps exacte que aquest procés va prendre, però es destaca la capacitat del model per adaptar-se a canvis i aprendre patrons durant el rendiment.
L'ús de videojocs per avaluar la intel·ligència artificial no és nou. Tot i això, aquest experiment reforça la idea que aquests entorns es poden convertir en eines fonamentals per mesurar avenços en models de IA capaços de raonar i adaptar-se.
Més enllà del joc: Claude 3.7 Sonnet i les seves aplicacions reals

A més de demostrar habilitats dins de Pokémon Rojo, Anthropic ha destacat que el seu model d'IA és capaç de resoldre problemes complexos en àmbits com les matemàtiques, la programació i la codificació. Com a part de les seves millores, s'hi ha afegit una funció anomenada Claude Code, que permet a la IA buscar i editar codi, executar proves i fins i tot treballar amb eines com GitHub.
Per a aquells interessats a provar les capacitats del model, Claude 3.7 Sonnet ja està disponible en diverses plataformes, incloent-hi l'app de Claude, l'API d'Anthropic, Amazon Bedrock i Google Cloud, mantenint el mateix cost d'accés que la versió anterior.
El fet que Claude 3.7 Sonnet hagi aconseguit superar etapes clau dins de Pokémon Rojo reforça la idea que les intel·ligències artificials estan avançant a passos de gegant en termes de raonament i aprenentatge. Aquest tipus de proves obren la porta a noves aplicacions al món real, des de l'automatització de tasques fins a la resolució de problemes complexos sense intervenció humana.
Sóc un apassionat de la tecnologia que ha convertit els seus interessos frikis en professió. Porto més de 10 anys de la meva vida utilitzant tecnologia d'avantguarda i traslladant tota mena de programes per pura curiositat. Ara he especialitzat en tecnologia d'ordinador i videojocs. Això és perquè des de fa més de 5 anys que treballo redactant per a diverses webs en matèria de tecnologia i videojocs, creant articles que busquen donar-te la informació que necessites amb un llenguatge comprensible per tothom.
Si tens qualsevol pregunta, els meus coneixements van des de tot allò relacionat amb el sistema operatiu Windows així com Android per a mòbils. I és que el meu compromís és amb tu, sempre estic disposat a dedicar-te uns minuts i ajudar-te a resoldre qualsevol dubte que tinguis a aquest món d'internet.