Anthropics AI Claude spiller Pokémon på Twitch og overrasker med sin ræsonnement

Sidste ændring: 28/02/2025

  • Anthropics Claude 3.7 Sonnet er blevet testet med at spille Pokémon Red på Twitch.
  • AI-modellen har vist betydelige fremskridt i ræsonnement og beslutningstagning.
  • Han formåede at besejre de første tre Gym Leaders i spillet, noget som tidligere versioner ikke formåede at opnå.
  • Anthropic fremhæver brugen af ​​videospil som en evalueringsmetode for kunstig intelligens.
Claude Ais mest kritiske øjeblik i Pokémon

Anthropic har overrasket verden af ​​kunstig intelligens ved at demonstrere, hvor langt dens nye Claude 3.7 Sonnet-model kan gå i komplekse opgaver. Ved denne lejlighed, og som en del af en innovativ test af kapaciteter, AI-systemet blev sat til at spille Pokémon Red i Twitch, hvor seerne kunne følge udviklingen live.

Eksperimentet søger at vise, hvordan kunstig intelligens kan træffe strategiske beslutninger og lær at navigere i et dynamisk miljø uden menneskelig indgriben. Dette markerer en milepæl sammenlignet med tidligere versioner af modellen, som ikke havde formået at overvinde tidlige barrierer i spillet.

Eksklusivt indhold - Klik her  Komplet guide til brug af Google Veo 3: Metoder, krav og tips 2025

Claude 3.7 Sonnet demonstrerer fremskridt i ræsonnementet

Claude 3.7 sonet

For at evaluere forbedringer af AI-modellen forsynede Anthropic den med visse nøgleværktøjer: Display pixel input, grundlæggende hukommelse og knap kontrol. Takket være disse elementer var Claude i stand til at fortolke, hvad der skete i spillet og træffe beslutninger baseret på dets interne logik.

I tidligere modeller, såsom Claude 3.0 Sonnet, kunstig intelligens Han nåede ikke engang at forlade hovedpersonens hus.. Men i denne nye iteration er systemet avanceret betydeligt, og det lykkedes at slå Brock, Misty og Lt. Surge, de første tre Gym Leaders i spillet.

En rejse med 35.000 handlinger i Pokémon-verdenen

Claude AI spiller Pokémon

Claudes rejse i Pokémon Red var ikke let. Ifølge data leveret af Anthropic blev AI udført omkring 35.000 aktier indtil det lykkedes at overvinde Ciudad Carmín-fasen. Den nøjagtige tid denne proces tog var ikke specificeret, men modellens evne til tilpasse sig ændringer og lære mønstre under deres optræden.

Eksklusivt indhold - Klik her  Google Scholar Labs: Sådan fungerer den nye AI-drevne akademiske søgning

Det er ikke nyt at bruge videospil til at evaluere kunstig intelligens. Dette eksperiment forstærker dog ideen om det Disse miljøer kan blive grundlæggende værktøjer at måle fremskridt i AI-modeller, der er i stand til at ræsonnere og tilpasse sig.

Ud over spillet: Claude 3.7 Sonnet og dens applikationer fra den virkelige verden

Anthropic præsenterer Claude 3.7 Sonnet-2

Udover at demonstrere færdigheder inden for Pokémon Red, har Anthropic fremhævet, at dens AI-model er i stand til løse komplekse problemer inden for områder som matematik, programmering og kodning. Som en del af dets forbedringer er der tilføjet en funktion kaldet Claude Code, som giver AI mulighed for at søge og redigere kode, køre test og endda arbejde med værktøjer som GitHub.

For dem, der er interesserede i at teste modellens muligheder, er Claude 3.7 Sonnet nu tilgængelig på en række forskellige platforme, bl.a. Claudes app, Anthropic API, Amazon Bedrock og Google Cloud, med samme adgangsomkostninger som dens tidligere version.

Claude 3.7 sonet
relateret artikel:
Anthropic introducerer Claude 3.7 Sonnet: Hybrid AI med avanceret ræsonnement

Det faktum, at Claude 3.7 Sonnet har formået at overvinde vigtige stadier inden for Pokémon Red, forstærker ideen om, at Kunstig intelligens går frem med stormskridt med hensyn til ræsonnement og læring. Denne type test åbner døren til Nye applikationer fra den virkelige verden, fra automatisering af opgaver til løsning af komplekse problemer uden menneskelig indgriben.

Eksklusivt indhold - Klik her  Hvordan kender jeg min IQ med Tontometer?