AI de la Anthropic, Claude joacă Pokémon pe Twitch și surprinde cu capacitatea sa de raționament

Ultima actualizare: 28/02/2025

  • Claude 3.7 Sonnet de la Anthropic a fost testat jucând Pokémon Red pe Twitch.
  • Modelul AI a demonstrat progrese semnificative în raționament și luarea deciziilor.
  • El a reușit să-i învingă pe primii trei Gym Leaders din joc, lucru pe care versiunile anterioare nu l-au reușit.
  • Anthropic evidențiază utilizarea jocurilor video ca metodă de evaluare a inteligenței artificiale.
Cel mai critic moment al lui Claude Ai în Pokémon

Anthropic a surprins lumea inteligenței artificiale demonstrând cât de departe poate merge noul său model Claude 3.7 Sonnet în sarcini complexe. Cu această ocazie și ca parte a unui test inovator de capabilități, Sistemul AI a fost pus să joace Pokémon Red în TIC nervos, unde telespectatorii au putut urmări progresul în direct.

Experimentul încearcă să arate cum poate inteligența artificială ia decizii strategice și învață să navighezi într-un mediu dinamic fără intervenția umană. Aceasta marchează o piatră de hotar în comparație cu versiunile anterioare ale modelului, care nu au reușit să depășească barierele timpurii din joc.

Conținut exclusiv - Faceți clic aici  Ghid complet pentru utilizarea Google Veo 3: Metode, cerințe și sfaturi 2025

Claude 3.7 Sonetul demonstrează progrese în raționament

Claude 3.7 Sonetul

Pentru a evalua îmbunătățirile aduse modelului AI, Anthropic i-a furnizat anumite instrumente cheie: Afișează intrarea pixelilor, memoria de bază și controlul butoanelor. Datorită acestor elemente, Claude a putut să interpreteze ceea ce se întâmplă în joc și să ia decizii pe baza logicii sale interne.

În modelele anterioare, cum ar fi Claude 3.0 Sonnet, inteligența artificială Nici măcar nu a reușit să iasă din casa personajului principal.. Cu toate acestea, în această nouă iterație, sistemul a avansat considerabil, reușind să-i învingă pe Brock, Misty și Lt. Surge, primii trei Gym Leaders din joc.

O călătorie de 35.000 de acțiuni în lumea Pokémon

Claude AI joacă Pokemon

Călătoria lui Claude în Pokémon Red nu a fost ușoară. Conform datelor furnizate de Anthropic, AI a executat aproximativ 35.000 de acțiuni până a reușit să depășească etapa Ciudad Carmín. Timpul exact pe care a durat acest proces nu a fost specificat, dar capacitatea modelului de a face acest lucru adaptați-vă la schimbări și învățați modele în timpul performanței lor.

Conținut exclusiv - Faceți clic aici  Google Scholar Labs: Așa funcționează noua căutare academică bazată pe inteligență artificială

Utilizarea jocurilor video pentru a evalua inteligența artificială nu este nouă. Cu toate acestea, acest experiment întărește ideea că Aceste medii pot deveni instrumente fundamentale pentru a măsura progresul în modelele AI capabile să raționeze și să se adapteze.

Dincolo de joc: Claude 3.7 Sonnet și aplicațiile sale din lumea reală

Anthropic prezintă Claude 3.7 Sonet-2

Pe lângă faptul că demonstrează abilități în cadrul Pokémon Red, Anthropic a subliniat că modelul său AI este capabil rezolva probleme complexe în domenii precum matematica, programarea și codificarea. Ca parte a îmbunătățirilor sale, a fost adăugată o funcție numită Claude Code, care permite AI să caute și să editeze cod, să execute teste și chiar să lucreze cu instrumente precum GitHub.

Pentru cei interesați să testeze capabilitățile modelului, Claude 3.7 Sonnet este acum disponibil pe o varietate de platforme, inclusiv Aplicația lui Claude, Anthropic API, Amazon Bedrock și Google Cloud, menținând același cost de acces ca și versiunea anterioară.

Claude 3.7 Sonetul
Articol asociat:
Anthropic prezintă Claude 3.7 Sonnet: IA hibridă cu raționament avansat

Faptul că Claude 3.7 Sonnet a reușit să depășească etape cheie în cadrul Pokémon Red întărește ideea că Inteligența artificială avansează cu salturi și limite în ceea ce privește raționamentul și învățarea. Acest tip de testare deschide ușa către Noi aplicații din lumea reală, de la automatizarea sarcinilor până la rezolvarea problemelor complexe fără intervenția umană.

Conținut exclusiv - Faceți clic aici  Cum îmi cunosc IQ-ul cu tontometrul?