L'IA di Anthropic Claude gioca a Pokémon su Twitch e sorprende con la sua capacità di ragionamento

Ultimo aggiornamento: 28/02/2025

  • Claude 3.7 Sonnet di Anthropic è stato testato giocando a Pokémon Rosso su Twitch.
  • Il modello di intelligenza artificiale ha dimostrato notevoli progressi nel ragionamento e nel processo decisionale.
  • Riuscì a sconfiggere i primi tre Capipalestra del gioco, cosa che le versioni precedenti non erano riuscite a fare.
  • Anthropic evidenzia l'uso dei videogiochi come metodo di valutazione dell'intelligenza artificiale.
Il momento più critico di Claude Ai in Pokémon

Anthropic ha sorpreso il mondo dell'intelligenza artificiale dimostrando fino a che punto il suo nuovo modello Claude 3.7 Sonnet può arrivare nei compiti complessi. In questa occasione, e come parte di un innovativo test di capacità, Il sistema di intelligenza artificiale è stato messo in gioco per giocare a Pokémon Rosso in Twitch, dove gli spettatori hanno potuto seguire l'avanzamento dei lavori in diretta.

L'esperimento cerca di mostrare come l'intelligenza artificiale può prendere decisioni strategiche e imparare a muoversi in un ambiente dinamico senza l'intervento umano. Ciò rappresenta una pietra miliare rispetto alle versioni precedenti del modello, che non erano riuscite a superare le barriere iniziali del gioco.

Contenuti esclusivi: clicca qui  Guida completa all'utilizzo di Google Veo 3: metodi, requisiti e suggerimenti 2025

Claude 3.7 Il sonetto dimostra progressi nel ragionamento

Claude 3.7 Sonetto

Per valutare i miglioramenti del modello di intelligenza artificiale, Anthropic ha fornito alcuni strumenti chiave: Input pixel del display, memoria di base e controllo dei pulsanti. Grazie a questi elementi, Claude è stato in grado di interpretare ciò che accadeva nel gioco e di prendere decisioni basate sulla sua logica interna.

Nei modelli precedenti, come il Claude 3.0 Sonnet, l'intelligenza artificiale Non è nemmeno riuscito a lasciare la casa del personaggio principale.. Tuttavia, in questa nuova iterazione, il sistema ha fatto notevoli progressi, riuscendo a sconfiggere Brock, Misty e Lt. Surge, i primi tre Capipalestra del gioco.

Un viaggio di 35.000 azioni nel mondo Pokémon

Claude AI gioca a Pokémon

Il viaggio di Claude in Pokémon Rosso non è stato facile. Secondo i dati forniti da Anthropic, l'IA ha eseguito circa 35.000 azioni fino a riuscire a superare la tappa di Ciudad Carmín. Il tempo esatto impiegato da questo processo non è stato specificato, ma è stata valutata la capacità del modello di adattarsi ai cambiamenti e apprendere modelli durante la loro esibizione.

Contenuti esclusivi: clicca qui  Google Scholar Labs: ecco come funziona la nuova ricerca accademica basata sull'intelligenza artificiale

L'utilizzo dei videogiochi per valutare l'intelligenza artificiale non è una novità. Tuttavia, questo esperimento rafforza l'idea che Questi ambienti possono diventare strumenti fondamentali per misurare i progressi nei modelli di intelligenza artificiale capaci di ragionare e adattarsi.

Oltre il gioco: Claude 3.7 Sonnet e le sue applicazioni nel mondo reale

Anthropic presenta Claude 3.7 Sonetto-2

Oltre a dimostrare le abilità all'interno di Pokémon Rosso, Anthropic ha evidenziato che il suo modello di intelligenza artificiale è in grado di risolvere problemi complessi in campi quali matematica, programmazione e codifica. Tra i miglioramenti, è stata aggiunta una funzionalità chiamata Claude Code, che consente all'intelligenza artificiale di cercare e modificare il codice, eseguire test e persino lavorare con strumenti come GitHub.

Per coloro interessati a testare le capacità del modello, Claude 3.7 Sonnet è ora disponibile su una varietà di piattaforme, tra cui L'app di Claude, Anthropic API, Amazon Bedrock e Google Cloud, mantenendo lo stesso costo di accesso della versione precedente.

Claude 3.7 Sonetto
Articolo correlato:
Anthropic presenta Claude 3.7 Sonnet: intelligenza artificiale ibrida con ragionamento avanzato

Il fatto che Claude 3.7 Sonnet sia riuscito a superare le fasi chiave all'interno di Pokémon Rosso rafforza l'idea che L'intelligenza artificiale sta avanzando a passi da gigante in termini di ragionamento e apprendimento. Questo tipo di test apre la porta a Nuove applicazioni nel mondo reale, dall'automazione delle attività alla risoluzione di problemi complessi senza l'intervento umano.

Contenuti esclusivi: clicca qui  Come conoscere il mio QI con il Tontometro?