Anthropicov AI Claude igra Pokémone na Twitchu in preseneti s svojo sposobnostjo razmišljanja

Zadnja posodobitev: 28/02/2025

  • Anthropicov Claude 3.7 Sonnet je bil preizkušen z igranjem igre Pokémon Red na Twitchu.
  • Model AI je pokazal pomemben napredek pri sklepanju in odločanju.
  • Uspelo mu je premagati prve tri Gym Leaders v igri, kar prejšnjim različicam ni uspelo.
  • Anthropic poudarja uporabo videoiger kot metode ocenjevanja umetne inteligence.
Najbolj kritičen trenutek Clauda Aija v Pokémonu

Anthropic je presenetil svet umetne inteligence s prikazom, kako daleč lahko gre njegov novi model Claude 3.7 Sonnet pri kompleksnih nalogah. Ob tej priložnosti in v okviru inovativnega preizkusa zmogljivosti, Sistem AI je bil postavljen za igranje Pokémon Red Trzanje, kjer so gledalci lahko spremljali potek v živo.

Eksperiment želi pokazati, kako lahko umetna inteligenca sprejemati strateške odločitve in se naučite krmariti v dinamičnem okolju brez človekovega posredovanja. To pomeni mejnik v primerjavi s prejšnjimi različicami modela, ki jim ni uspelo premagati zgodnjih ovir v igri.

Ekskluzivna vsebina - Kliknite tukaj  Popoln vodnik za uporabo Google Veo 3: metode, zahteve in nasveti 2025

Sonet Claude 3.7 kaže napredek v razmišljanju

Claude 3.7 Sonet

Za oceno izboljšav modela AI je Anthropic priskrbel določena ključna orodja: Vnos slikovnih pik zaslona, ​​osnovni pomnilnik in upravljanje z gumbi. Zahvaljujoč tem elementom je Claude lahko interpretiral dogajanje v igri in sprejemal odločitve na podlagi svoje notranje logike.

V prejšnjih modelih, kot je Claude 3.0 Sonnet, je umetna inteligenca Sploh mu ni uspelo zapustiti hiše glavnega junaka.. Vendar pa je v tej novi ponovitvi sistem precej napredoval in uspel premagati Brocka, Mistyja in poročnika Surgea, prve tri Gym Leaders v igri.

Potovanje s 35.000 dejanji v svetu Pokémonov

Claude AI igra Pokémone

Claudovo potovanje v Pokémon Red ni bilo enostavno. Po podatkih, ki jih je zagotovil Anthropic, je umetna inteligenca izvedena okoli 35.000 delnic dokler ni uspelo premagati etape Ciudad Carmín. Natančen čas, ki je trajal ta proces, ni bil določen, ampak sposobnost modela, da prilagajati se spremembam in se učiti vzorcev med njihovim nastopom.

Ekskluzivna vsebina - Kliknite tukaj  Google Scholar Labs: Tako deluje novo akademsko iskanje, ki ga poganja umetna inteligenca

Uporaba video iger za ocenjevanje umetne inteligence ni nova. Vendar pa ta poskus krepi idejo, da Ta okolja lahko postanejo temeljna orodja za merjenje napredka pri modelih umetne inteligence, ki so sposobni razmišljati in se prilagajati.

Onstran igre: Claude 3.7 Sonnet in njegove aplikacije v resničnem svetu

Anthropic predstavlja Claude 3.7 Sonnet-2

Poleg dokazovanja veščin znotraj Pokémon Red je Anthropic poudaril, da je njegov model AI sposoben rešiti zapletene probleme na področjih, kot so matematika, programiranje in kodiranje. Kot del izboljšav je bila dodana funkcija, imenovana Claude Code, ki omogoča AI iskanje in urejanje kode, izvajanje testov in celo delo z orodji, kot je GitHub.

Za tiste, ki jih zanima preizkušanje zmogljivosti modela, je Claude 3.7 Sonnet zdaj na voljo na različnih platformah, vključno z Claudeova aplikacija, Anthropic API, Amazon Bedrock in Google Cloud, ki ohranja enake stroške dostopa kot prejšnja različica.

Claude 3.7 Sonet
Povezani članek:
Anthropic predstavlja Claude 3.7 Sonnet: Hybrid AI with Advanced Reasoning

Dejstvo, da je Claude 3.7 Sonnet uspel premagati ključne stopnje znotraj Pokémon Red, krepi idejo, da Umetna inteligenca z velikimi koraki napreduje v smislu sklepanja in učenja. Tovrstno testiranje odpira vrata do Nove aplikacije v resničnem svetu, od avtomatizacije nalog do reševanja kompleksnih problemov brez človeškega posredovanja.

Ekskluzivna vsebina - Kliknite tukaj  Kako ugotoviti svoj IQ s tontometrom?