- Claude 3.7 Sonnet de la Anthropic a fost testat jucând Pokémon Red pe Twitch.
- Modelul AI a demonstrat progrese semnificative în raționament și luarea deciziilor.
- El a reușit să-i învingă pe primii trei Gym Leaders din joc, lucru pe care versiunile anterioare nu l-au reușit.
- Anthropic evidențiază utilizarea jocurilor video ca metodă de evaluare a inteligenței artificiale.
Anthropic a surprins lumea inteligenței artificiale demonstrând cât de departe poate merge noul său model Claude 3.7 Sonnet în sarcini complexe. Cu această ocazie și ca parte a unui test inovator de capabilități, Sistemul AI a fost pus să joace Pokémon Red în TIC nervos, unde telespectatorii au putut urmări progresul în direct.
Experimentul încearcă să arate cum poate inteligența artificială ia decizii strategice și învață să navighezi într-un mediu dinamic fără intervenția umană. Aceasta marchează o piatră de hotar în comparație cu versiunile anterioare ale modelului, care nu au reușit să depășească barierele timpurii din joc.
Claude 3.7 Sonetul demonstrează progrese în raționament

Pentru a evalua îmbunătățirile aduse modelului AI, Anthropic i-a furnizat anumite instrumente cheie: Afișează intrarea pixelilor, memoria de bază și controlul butoanelor. Datorită acestor elemente, Claude a putut să interpreteze ceea ce se întâmplă în joc și să ia decizii pe baza logicii sale interne.
În modelele anterioare, cum ar fi Claude 3.0 Sonnet, inteligența artificială Nici măcar nu a reușit să iasă din casa personajului principal.. Cu toate acestea, în această nouă iterație, sistemul a avansat considerabil, reușind să-i învingă pe Brock, Misty și Lt. Surge, primii trei Gym Leaders din joc.
O călătorie de 35.000 de acțiuni în lumea Pokémon

Călătoria lui Claude în Pokémon Red nu a fost ușoară. Conform datelor furnizate de Anthropic, AI a executat aproximativ 35.000 de acțiuni până a reușit să depășească etapa Ciudad Carmín. Timpul exact pe care a durat acest proces nu a fost specificat, dar capacitatea modelului de a face acest lucru adaptați-vă la schimbări și învățați modele în timpul performanței lor.
Utilizarea jocurilor video pentru a evalua inteligența artificială nu este nouă. Cu toate acestea, acest experiment întărește ideea că Aceste medii pot deveni instrumente fundamentale pentru a măsura progresul în modelele AI capabile să raționeze și să se adapteze.
Dincolo de joc: Claude 3.7 Sonnet și aplicațiile sale din lumea reală

Pe lângă faptul că demonstrează abilități în cadrul Pokémon Red, Anthropic a subliniat că modelul său AI este capabil rezolva probleme complexe în domenii precum matematica, programarea și codificarea. Ca parte a îmbunătățirilor sale, a fost adăugată o funcție numită Claude Code, care permite AI să caute și să editeze cod, să execute teste și chiar să lucreze cu instrumente precum GitHub.
Pentru cei interesați să testeze capabilitățile modelului, Claude 3.7 Sonnet este acum disponibil pe o varietate de platforme, inclusiv Aplicația lui Claude, Anthropic API, Amazon Bedrock și Google Cloud, menținând același cost de acces ca și versiunea anterioară.
Faptul că Claude 3.7 Sonnet a reușit să depășească etape cheie în cadrul Pokémon Red întărește ideea că Inteligența artificială avansează cu salturi și limite în ceea ce privește raționamentul și învățarea. Acest tip de testare deschide ușa către Noi aplicații din lumea reală, de la automatizarea sarcinilor până la rezolvarea problemelor complexe fără intervenția umană.
Sunt un pasionat de tehnologie care și-a transformat interesele de „tocilar” într-o profesie. Mi-am petrecut mai bine de 10 ani din viața mea folosind tehnologie de ultimă oră și mânuind cu tot felul de programe din pură curiozitate. Acum m-am specializat în tehnologie computerizată și jocuri video. Asta pentru că de mai bine de 5 ani scriu pentru diverse site-uri web despre tehnologie și jocuri video, creând articole care urmăresc să-ți ofere informațiile de care ai nevoie într-un limbaj pe care oricine este pe înțeles.
Dacă aveți întrebări, cunoștințele mele variază de la tot ce ține de sistemul de operare Windows, precum și Android pentru telefoane mobile. Și angajamentul meu este față de tine, sunt mereu dispus să petrec câteva minute și să te ajut să rezolvi orice întrebări pe care le poți avea în această lume a internetului.