Anthropics AI Claude spiller Pokémon på Twitch og overrasker med sin resonneringsevne

Siste oppdatering: 28/02/2025

  • Anthropics Claude 3.7 Sonnet har blitt testet å spille Pokémon Red på Twitch.
  • AI-modellen har vist betydelig fremgang i resonnement og beslutningstaking.
  • Han klarte å beseire de tre første Gym-lederne i spillet, noe som tidligere versjoner ikke klarte å oppnå.
  • Anthropic fremhever bruken av videospill som en evalueringsmetode for kunstig intelligens.
Claude Ais mest kritiske øyeblikk i Pokémon

Anthropic har overrasket verden av kunstig intelligens ved å demonstrere hvor langt dens nye Claude 3.7 Sonnet-modell kan gå i komplekse oppgaver. Ved denne anledningen, og som en del av en nyskapende test av evner, AI-systemet ble satt til å spille Pokémon Red i Nappe, hvor seerne kunne følge fremgangen live.

Eksperimentet søker å vise hvordan kunstig intelligens kan ta strategiske beslutninger og lære å navigere i et dynamisk miljø uten menneskelig innblanding. Dette markerer en milepæl sammenlignet med tidligere versjoner av modellen, som ikke hadde klart å overvinne tidlige barrierer i spillet.

Eksklusivt innhold - Klikk her  Jason Momoa avslører nye detaljer om rollen hans som Lobo i DCU.

Claude 3.7 Sonnet demonstrerer fremskritt i resonnement

Claude 3.7 sonett

For å evaluere forbedringer av AI-modellen ga Anthropic den med visse nøkkelverktøy: Vis pikselinngang, grunnleggende minne og knappkontroll. Takket være disse elementene var Claude i stand til å tolke hva som skjedde i spillet og ta avgjørelser basert på dens interne logikk.

I tidligere modeller, som Claude 3.0 Sonnet, kunstig intelligens Han rakk ikke engang å forlate hovedpersonens hus.. Men i denne nye iterasjonen har systemet avansert betydelig, og klart å slå Brock, Misty og Lt. Surge, de tre første treningslederne i spillet.

En reise med 35.000 XNUMX handlinger i Pokémon-verdenen

Claude AI spiller Pokémon

Claudes reise i Pokémon Red var ikke lett. I følge data levert av Anthropic ble AI utført rundt 35.000 aksjer før de klarte å overvinne Ciudad Carmín-scenen. Den nøyaktige tiden denne prosessen tok var ikke spesifisert, men modellens evne til tilpasse seg endringer og lære mønstre under opptredenen deres.

Eksklusivt innhold - Klikk her  Windows 11 Agentic AI: Fremtiden for autonom kunstig intelligens har kommet til PC-en din.

Å bruke videospill for å evaluere kunstig intelligens er ikke nytt. Dette eksperimentet forsterker imidlertid ideen om det Disse miljøene kan bli grunnleggende verktøy å måle fremgang i AI-modeller som er i stand til å resonnere og tilpasse seg.

Utover spillet: Claude 3.7 Sonnet og dens virkelige applikasjoner

Anthropic presenterer Claude 3.7 Sonnet-2

I tillegg til å demonstrere ferdigheter innen Pokémon Red, har Anthropic fremhevet at AI-modellen er i stand til løse komplekse problemer innen felt som matematikk, programmering og koding. Som en del av forbedringene har en funksjon kalt Claude Code blitt lagt til, som lar AI søke og redigere kode, kjøre tester og til og med jobbe med verktøy som GitHub.

For de som er interessert i å teste egenskapene til modellen, er Claude 3.7 Sonnet nå tilgjengelig på en rekke plattformer, bl.a. Claudes app, Anthropic API, Amazon Bedrock og Google Cloud, opprettholde samme tilgangskostnad som den forrige versjonen.

Claude 3.7 sonett
Relatert artikkel:
Anthropic introduserer Claude 3.7 Sonnet: Hybrid AI med avansert resonnement

Det faktum at Claude 3.7 Sonnet har klart å overvinne viktige stadier i Pokémon Red forsterker ideen om at Kunstig intelligens går fremover med stormskritt når det gjelder resonnement og læring. Denne typen testing åpner døren til Nye applikasjoner fra den virkelige verden, fra automatisering av oppgaver til å løse komplekse problemer uten menneskelig innblanding.

Eksklusivt innhold - Klikk her  MARVEL Cosmic Invasion-demoen er nå tilgjengelig på Steam.