- Anthropics Claude 3.7 Sonnet er blevet testet med at spille Pokémon Red på Twitch.
- AI-modellen har vist betydelige fremskridt i ræsonnement og beslutningstagning.
- Han formåede at besejre de første tre Gym Leaders i spillet, noget som tidligere versioner ikke formåede at opnå.
- Anthropic fremhæver brugen af videospil som en evalueringsmetode for kunstig intelligens.
Anthropic har overrasket verden af kunstig intelligens ved at demonstrere, hvor langt dens nye Claude 3.7 Sonnet-model kan gå i komplekse opgaver. Ved denne lejlighed, og som en del af en innovativ test af kapaciteter, AI-systemet blev sat til at spille Pokémon Red i Twitch, hvor seerne kunne følge udviklingen live.
Eksperimentet søger at vise, hvordan kunstig intelligens kan træffe strategiske beslutninger og lær at navigere i et dynamisk miljø uden menneskelig indgriben. Dette markerer en milepæl sammenlignet med tidligere versioner af modellen, som ikke havde formået at overvinde tidlige barrierer i spillet.
Claude 3.7 Sonnet demonstrerer fremskridt i ræsonnementet

For at evaluere forbedringer af AI-modellen forsynede Anthropic den med visse nøgleværktøjer: Display pixel input, grundlæggende hukommelse og knap kontrol. Takket være disse elementer var Claude i stand til at fortolke, hvad der skete i spillet og træffe beslutninger baseret på dets interne logik.
I tidligere modeller, såsom Claude 3.0 Sonnet, kunstig intelligens Han nåede ikke engang at forlade hovedpersonens hus.. Men i denne nye iteration er systemet avanceret betydeligt, og det lykkedes at slå Brock, Misty og Lt. Surge, de første tre Gym Leaders i spillet.
En rejse med 35.000 handlinger i Pokémon-verdenen

Claudes rejse i Pokémon Red var ikke let. Ifølge data leveret af Anthropic blev AI udført omkring 35.000 aktier indtil det lykkedes at overvinde Ciudad Carmín-fasen. Den nøjagtige tid denne proces tog var ikke specificeret, men modellens evne til tilpasse sig ændringer og lære mønstre under deres optræden.
Det er ikke nyt at bruge videospil til at evaluere kunstig intelligens. Dette eksperiment forstærker dog ideen om det Disse miljøer kan blive grundlæggende værktøjer at måle fremskridt i AI-modeller, der er i stand til at ræsonnere og tilpasse sig.
Ud over spillet: Claude 3.7 Sonnet og dens applikationer fra den virkelige verden

Udover at demonstrere færdigheder inden for Pokémon Red, har Anthropic fremhævet, at dens AI-model er i stand til løse komplekse problemer inden for områder som matematik, programmering og kodning. Som en del af dets forbedringer er der tilføjet en funktion kaldet Claude Code, som giver AI mulighed for at søge og redigere kode, køre test og endda arbejde med værktøjer som GitHub.
For dem, der er interesserede i at teste modellens muligheder, er Claude 3.7 Sonnet nu tilgængelig på en række forskellige platforme, bl.a. Claudes app, Anthropic API, Amazon Bedrock og Google Cloud, med samme adgangsomkostninger som dens tidligere version.
Det faktum, at Claude 3.7 Sonnet har formået at overvinde vigtige stadier inden for Pokémon Red, forstærker ideen om, at Kunstig intelligens går frem med stormskridt med hensyn til ræsonnement og læring. Denne type test åbner døren til Nye applikationer fra den virkelige verden, fra automatisering af opgaver til løsning af komplekse problemer uden menneskelig indgriben.
Jeg er en teknologientusiast, der har vendt sine "nørde" interesser til et erhverv. Jeg har brugt mere end 10 år af mit liv på at bruge avanceret teknologi og pille ved alle slags programmer af ren nysgerrighed. Nu har jeg specialiseret mig i computerteknologi og videospil. Dette skyldes, at jeg i mere end 5 år har skrevet til forskellige hjemmesider om teknologi og videospil, og lavet artikler, der søger at give dig den information, du har brug for, på et sprog, der er forståeligt for alle.
Har du spørgsmål, så spænder min viden fra alt relateret til Windows styresystemet samt Android til mobiltelefoner. Og mit engagement er over for dig, jeg er altid villig til at bruge et par minutter og hjælpe dig med at løse eventuelle spørgsmål, du måtte have i denne internetverden.