- Anthropic se Claude 3.7 Sonnet is getoets om Pokémon Red op Twitch te speel.
- Die KI-model het aansienlike vordering in redenering en besluitneming getoon.
- Hy het daarin geslaag om die eerste drie Gym Leaders in die spel te verslaan, iets wat vorige weergawes nie kon bereik nie.
- Anthropic beklemtoon die gebruik van videospeletjies as 'n evalueringsmetode vir kunsmatige intelligensie.
Antropies het die wêreld van kunsmatige intelligensie verras deur te demonstreer hoe ver sy nuwe Claude 3.7 Sonnet-model in komplekse take kan gaan. By hierdie geleentheid, en as deel van 'n innoverende toets van vermoëns, Die KI-stelsel is ingestel om Pokémon Red in te speel Twitch, waar kykers die vordering regstreeks kon volg.
Die eksperiment poog om te wys hoe kunsmatige intelligensie kan strategiese besluite te neem en leer om 'n dinamiese omgewing te navigeer sonder menslike ingryping. Dit is 'n mylpaal in vergelyking met vorige weergawes van die model, wat nie daarin geslaag het om vroeë hindernisse binne die spel te oorkom nie.
Claude 3.7 Sonnet demonstreer vooruitgang in redenasie

Om verbeterings aan die KI-model te evalueer, het Anthropic dit van sekere sleutelinstrumente voorsien: Vertoon pixel-invoer, basiese geheue en knoppiebeheer. Danksy hierdie elemente kon Claude interpreteer wat in die spel gebeur en besluite neem op grond van die interne logika daarvan.
In vorige modelle, soos die Claude 3.0 Sonnet, kunsmatige intelligensie Hy het nie eers daarin geslaag om die hoofkarakter se huis te verlaat nie.. In hierdie nuwe iterasie het die stelsel egter aansienlik gevorder en daarin geslaag om Brock, Misty en Lt. Surge, die eerste drie Gim-leiers in die spel, te klop.
'n Reis van 35.000 XNUMX aksies binne die Pokémon-wêreld

Claude se reis in Pokémon Red was nie maklik nie. Volgens data verskaf deur Anthropic, is die KI uitgevoer sowat 35.000 XNUMX aandele totdat dit reggekry het om die Ciudad Carmín-stadium te oorkom. Die presiese tyd wat hierdie proses geneem het, is nie gespesifiseer nie, maar die model se vermoë om pas by veranderinge aan en leer patrone aan tydens hul optrede.
Die gebruik van videospeletjies om kunsmatige intelligensie te evalueer is nie nuut nie. Hierdie eksperiment versterk egter die idee dat Hierdie omgewings kan fundamentele instrumente word om vordering te meet in KI-modelle wat in staat is om te redeneer en aan te pas.
Beyond the game: Claude 3.7 Sonnet en sy werklike toepassings

Benewens die demonstrasie van vaardighede binne Pokémon Red, het Anthropic beklemtoon dat sy KI-model in staat is om komplekse probleme op te los in velde soos wiskunde, programmering en kodering. As deel van sy verbeterings, is 'n kenmerk genaamd Claude Code bygevoeg, wat KI toelaat om kode te soek en te wysig, toetse uit te voer en selfs met nutsgoed soos GitHub te werk.
Vir diegene wat belangstel om die vermoëns van die model te toets, is Claude 3.7 Sonnet nou beskikbaar op 'n verskeidenheid platforms, insluitend Claude se app, Antropiese API, Amazon Bedrock en Google Cloud, met dieselfde toegangskoste as sy vorige weergawe.
Die feit dat Claude 3.7 Sonnet daarin geslaag het om sleutelfases binne Pokémon Red te oorkom, versterk die idee dat Kunsmatige intelligensie vorder met rasse skrede in terme van redenering en leer. Hierdie tipe toetsing maak die deur oop vir Nuwe werklike toepassings, van outomatisering van take tot die oplossing van komplekse probleme sonder menslike ingryping.
Ek is 'n tegnologie-entoesias wat sy "geek"-belangstellings in 'n beroep verander het. Ek het meer as 10 jaar van my lewe bestee om die nuutste tegnologie te gebruik en uit pure nuuskierigheid met allerhande programme te peuter. Nou het ek gespesialiseer in rekenaartegnologie en videospeletjies. Dit is omdat ek al vir meer as 5 jaar vir verskeie webwerwe oor tegnologie en videospeletjies skryf en artikels skep wat poog om jou die inligting te gee wat jy nodig het in 'n taal wat vir almal verstaanbaar is.
As jy enige vrae het, strek my kennis van alles wat verband hou met die Windows-bedryfstelsel sowel as Android vir selfone. En my verbintenis is aan jou, ek is altyd bereid om 'n paar minute te spandeer en jou te help om enige vrae op te los wat jy in hierdie internetwêreld mag hê.