Anthropic se AI Claude speel Pokémon op Twitch en verras met sy redenasievermoë

Laaste opdatering: 28/02/2025

  • Anthropic se Claude 3.7 Sonnet is getoets om Pokémon Red op Twitch te speel.
  • Die KI-model het aansienlike vordering in redenering en besluitneming getoon.
  • Hy het daarin geslaag om die eerste drie Gym Leaders in die spel te verslaan, iets wat vorige weergawes nie kon bereik nie.
  • Anthropic beklemtoon die gebruik van videospeletjies as 'n evalueringsmetode vir kunsmatige intelligensie.
Claude Ai se mees kritieke oomblik in Pokémon

Antropies het die wêreld van kunsmatige intelligensie verras deur te demonstreer hoe ver sy nuwe Claude 3.7 Sonnet-model in komplekse take kan gaan. By hierdie geleentheid, en as deel van 'n innoverende toets van vermoëns, Die KI-stelsel is ingestel om Pokémon Red in te speel Twitch, waar kykers die vordering regstreeks kon volg.

Die eksperiment poog om te wys hoe kunsmatige intelligensie kan strategiese besluite te neem en leer om 'n dinamiese omgewing te navigeer sonder menslike ingryping. Dit is 'n mylpaal in vergelyking met vorige weergawes van die model, wat nie daarin geslaag het om vroeë hindernisse binne die spel te oorkom nie.

Eksklusiewe inhoud - Klik hier  Wat is SearchGPT en hoe die nuwe KI-gebaseerde soekenjin werk

Claude 3.7 Sonnet demonstreer vooruitgang in redenasie

Claude 3.7 sonet

Om verbeterings aan die KI-model te evalueer, het Anthropic dit van sekere sleutelinstrumente voorsien: Vertoon pixel-invoer, basiese geheue en knoppiebeheer. Danksy hierdie elemente kon Claude interpreteer wat in die spel gebeur en besluite neem op grond van die interne logika daarvan.

In vorige modelle, soos die Claude 3.0 Sonnet, kunsmatige intelligensie Hy het nie eers daarin geslaag om die hoofkarakter se huis te verlaat nie.. In hierdie nuwe iterasie het die stelsel egter aansienlik gevorder en daarin geslaag om Brock, Misty en Lt. Surge, die eerste drie Gim-leiers in die spel, te klop.

'n Reis van 35.000 XNUMX aksies binne die Pokémon-wêreld

Claude AI speel Pokémon

Claude se reis in Pokémon Red was nie maklik nie. Volgens data verskaf deur Anthropic, is die KI uitgevoer sowat 35.000 XNUMX aandele totdat dit reggekry het om die Ciudad Carmín-stadium te oorkom. Die presiese tyd wat hierdie proses geneem het, is nie gespesifiseer nie, maar die model se vermoë om pas by veranderinge aan en leer patrone aan tydens hul optrede.

Eksklusiewe inhoud - Klik hier  Triple-I Inisiatief 2025: Die uiteindelike vertoonkas vir die indie-rewolusie

Die gebruik van videospeletjies om kunsmatige intelligensie te evalueer is nie nuut nie. Hierdie eksperiment versterk egter die idee dat Hierdie omgewings kan fundamentele instrumente word om vordering te meet in KI-modelle wat in staat is om te redeneer en aan te pas.

Beyond the game: Claude 3.7 Sonnet en sy werklike toepassings

Antropiese bied Claude 3.7 Sonnet-2 aan

Benewens die demonstrasie van vaardighede binne Pokémon Red, het Anthropic beklemtoon dat sy KI-model in staat is om komplekse probleme op te los in velde soos wiskunde, programmering en kodering. As deel van sy verbeterings, is 'n kenmerk genaamd Claude Code bygevoeg, wat KI toelaat om kode te soek en te wysig, toetse uit te voer en selfs met nutsgoed soos GitHub te werk.

Vir diegene wat belangstel om die vermoëns van die model te toets, is Claude 3.7 Sonnet nou beskikbaar op 'n verskeidenheid platforms, insluitend Claude se app, Antropiese API, Amazon Bedrock en Google Cloud, met dieselfde toegangskoste as sy vorige weergawe.

Claude 3.7 sonet
Verwante artikel:
Antropies stel Claude 3.7 Sonnet: Hibriede KI met gevorderde redenering bekend

Die feit dat Claude 3.7 Sonnet daarin geslaag het om sleutelfases binne Pokémon Red te oorkom, versterk die idee dat Kunsmatige intelligensie vorder met rasse skrede in terme van redenering en leer. Hierdie tipe toetsing maak die deur oop vir Nuwe werklike toepassings, van outomatisering van take tot die oplossing van komplekse probleme sonder menslike ingryping.

Eksklusiewe inhoud - Klik hier  Xbox stel Copilot for Gaming bekend: die KI wat die spelervaring sal transformeer