- Claude 3.7 Sonnet de Anthropic probouse xogando a Pokémon Red en Twitch.
- O modelo de IA demostrou un progreso significativo no razoamento e na toma de decisións.
- Conseguiu derrotar aos tres primeiros Gym Leaders do xogo, algo que as versións anteriores non lograron.
- Anthropic destaca o uso dos videoxogos como método de avaliación da intelixencia artificial.
Anthropic sorprendeu ao mundo da intelixencia artificial demostrando ata onde pode chegar o seu novo modelo Claude 3.7 Sonnet en tarefas complexas. Nesta ocasión, e como parte dunha innovadora proba de capacidades, O sistema de IA púxose para xogar a Pokémon Red Twitch, onde os espectadores puideron seguir o progreso en directo.
O experimento busca mostrar como pode a intelixencia artificial tomar decisións estratéxicas e aprender a navegar nun ambiente dinámico sen intervención humana. Isto marca un fito en comparación coas versións anteriores do modelo, que non lograran superar as primeiras barreiras dentro do xogo.
Claude 3.7 Soneto demostra avances no razoamento

Para avaliar as melloras do modelo de IA, Anthropic proporcionoulle certas ferramentas clave: Mostrar entrada de píxeles, memoria básica e control de botóns. Grazas a estes elementos, Claude puido interpretar o que pasaba no xogo e tomar decisións en función da súa lóxica interna.
En modelos anteriores, como o Soneto Claude 3.0, a intelixencia artificial Nin sequera conseguiu saír da casa do personaxe principal.. Non obstante, nesta nova iteración, o sistema avanzou considerablemente, logrando vencer a Brock, Misty e o tenente Surge, os tres primeiros líderes do ximnasio do xogo.
Unha viaxe de 35.000 accións dentro do mundo Pokémon

A viaxe de Claude en Pokémon Red non foi fácil. Segundo os datos proporcionados por Anthropic, a AI executou preto de 35.000 accións ata conseguir superar a etapa de Ciudad Carmín. Non se especificou o tempo exacto que levou este proceso, pero a capacidade do modelo adaptarse aos cambios e aprender patróns durante a súa actuación.
Usar videoxogos para avaliar a intelixencia artificial non é novo. Non obstante, este experimento reforza a idea de que Estes ambientes poden converterse en ferramentas fundamentais para medir o progreso en modelos de IA capaces de razoar e adaptarse.
Máis aló do xogo: Claude 3.7 Sonnet e as súas aplicacións no mundo real

Ademais de demostrar habilidades dentro de Pokémon Red, Anthropic destacou que o seu modelo de IA é capaz resolver problemas complexos en campos como matemáticas, programación e codificación. Como parte das súas melloras, engadiuse unha función chamada Claude Code, que permite á IA buscar e editar código, realizar probas e mesmo traballar con ferramentas como GitHub.
Para aqueles interesados en probar as capacidades do modelo, Claude 3.7 Sonnet xa está dispoñible nunha variedade de plataformas, incluíndo A aplicación de Claude, Anthropic API, Amazon Bedrock e Google Cloud, mantendo o mesmo custo de acceso que a súa versión anterior.
O feito de que Claude 3.7 Sonnet conseguise superar etapas clave dentro de Pokémon Red reforza a idea de que A intelixencia artificial avanza a pasos axigantados en termos de razoamento e aprendizaxe. Este tipo de probas abre a porta Novas aplicacións do mundo real, desde a automatización de tarefas ata a resolución de problemas complexos sen intervención humana.
Son un entusiasta da tecnoloxía que converteu os seus intereses "friki" nunha profesión. Levo máis de 10 anos da miña vida empregando tecnoloxía de punta e retocando todo tipo de programas por pura curiosidade. Agora especializeime en tecnoloxía informática e videoxogos. Isto débese a que dende hai máis de 5 anos levo escribindo para diversas webs sobre tecnoloxía e videoxogos, creando artigos que buscan darche a información que necesitas nun idioma comprensible para todos.
Se tes algunha dúbida, os meus coñecementos abarcan dende todo o relacionado co sistema operativo Windows e tamén con Android para teléfonos móbiles. E o meu compromiso é contigo, sempre estou disposto a dedicar uns minutos e axudarche a resolver calquera dúbida que teñas neste mundo de internet.