- Claude 3.7 Sonnet de Anthropic ha sido probado jugando a Pokémon Rojo en Twitch.
- El modelo de IA ha demostrado un avance significativo en razonamiento y toma de decisiones.
- Consiguió derrotar a los tres primeros líderes de gimnasio del juego, algo que versiones anteriores no lograron.
- Anthropic destaca el uso de videojuegos como método de evaluación para la inteligencia artificial.
Anthropic ha sorprendido al mundo de la inteligencia artificial al demostrar hasta dónde puede llegar su nuevo modelo Claude 3.7 Sonnet en tareas complejas. En esta ocasión, y como parte de una innovadora prueba de capacidades, el sistema de IA fue puesto a jugar a Pokémon Rojo en Twitch, donde los espectadores pudieron seguir en directo sus avances.
El experimento busca mostrar cómo la inteligencia artificial puede tomar decisiones estratégicas y aprender a desenvolverse en un entorno dinámico sin intervención humana. Esto marca un hito respecto a versiones anteriores del modelo, que no habían logrado superar barreras tempranas dentro del juego.
Claude 3.7 Sonnet demuestra avances en razonamiento
Para evaluar las mejoras en el modelo de IA, Anthropic le proporcionó ciertas herramientas clave: entrada de píxeles de la pantalla, memoria básica y control de botones. Gracias a estos elementos, Claude pudo interpretar lo que ocurría en el juego y tomar decisiones basadas en su lógica interna.
En modelos anteriores, como Claude 3.0 Sonnet, la inteligencia artificial ni siquiera logró salir de la casa del personaje principal. Sin embargo, en esta nueva iteración, el sistema avanzó considerablemente, logrando vencer a Brock, Misty y Lt. Surge, los tres primeros líderes de gimnasio del juego.
Un recorrido de 35.000 acciones dentro del mundo Pokémon
El recorrido de Claude en Pokémon Rojo no fue sencillo. Según los datos proporcionados por Anthropic, la IA ejecutó alrededor de 35.000 acciones hasta lograr superar la etapa de Ciudad Carmín. No se especificó el tiempo exacto que este proceso tomó, pero se destaca la capacidad del modelo para adaptarse a cambios y aprender patrones durante su rendimiento.
El uso de videojuegos para evaluar inteligencia artificial no es nuevo. Sin embargo, este experimento refuerza la idea de que estos entornos pueden convertirse en herramientas fundamentales para medir avances en modelos de IA capaces de razonar y adaptarse.
Más allá del juego: Claude 3.7 Sonnet y sus aplicaciones reales
Además de demostrar habilidades dentro de Pokémon Rojo, Anthropic ha destacado que su modelo de IA es capaz de resolver problemas complejos en ámbitos como las matemáticas, la programación y la codificación. Como parte de sus mejoras, se ha añadido una función llamada Claude Code, que permite a la IA buscar y editar código, ejecutar pruebas e incluso trabajar con herramientas como GitHub.
Para aquellos interesados en probar las capacidades del modelo, Claude 3.7 Sonnet ya está disponible en diversas plataformas, incluyendo la app de Claude, la API de Anthropic, Amazon Bedrock y Google Cloud, manteniendo el mismo costo de acceso que su versión anterior.
El hecho de que Claude 3.7 Sonnet haya logrado superar etapas clave dentro de Pokémon Rojo refuerza la idea de que las inteligencias artificiales están avanzando a pasos agigantados en términos de razonamiento y aprendizaje. Este tipo de pruebas abren la puerta a nuevas aplicaciones en el mundo real, desde la automatización de tareas hasta la resolución de problemas complejos sin intervención humana.
Soy un apasionado de la tecnología que ha convertido sus intereses «frikis» en profesión. Llevo más de 10 años de mi vida utilizando tecnología de vanguardia y trasteando todo tipo de programas por pura curiosidad. Ahora me he especializado en tecnología de ordenador y videojuegos. Esto es por que desde hace más de 5 años que trabajo redactando para varias webs en materia de tecnología y videojuegos, creando artículos que buscan darte la información que necesitas con un lenguaje entendible por todos.
Si tienes cualquier pregunta, mis conocimientos van desde todo lo relacionado con el sistema operativo Windows así como Android para móviles. Y es que mi compromiso es contigo, siempre estoy dispuesto a dedicarte unos minutos y ayudarte a resolver cualquier duda que tengas en este mundo de internet.