- Anthropicov Claude 3.7 Sonnet je bil preizkušen z igranjem igre Pokémon Red na Twitchu.
- Model AI je pokazal pomemben napredek pri sklepanju in odločanju.
- Uspelo mu je premagati prve tri Gym Leaders v igri, kar prejšnjim različicam ni uspelo.
- Anthropic poudarja uporabo videoiger kot metode ocenjevanja umetne inteligence.
Anthropic je presenetil svet umetne inteligence s prikazom, kako daleč lahko gre njegov novi model Claude 3.7 Sonnet pri kompleksnih nalogah. Ob tej priložnosti in v okviru inovativnega preizkusa zmogljivosti, Sistem AI je bil postavljen za igranje Pokémon Red Trzanje, kjer so gledalci lahko spremljali potek v živo.
Eksperiment želi pokazati, kako lahko umetna inteligenca sprejemati strateške odločitve in se naučite krmariti v dinamičnem okolju brez človekovega posredovanja. To pomeni mejnik v primerjavi s prejšnjimi različicami modela, ki jim ni uspelo premagati zgodnjih ovir v igri.
Sonet Claude 3.7 kaže napredek v razmišljanju

Za oceno izboljšav modela AI je Anthropic priskrbel določena ključna orodja: Vnos slikovnih pik zaslona, osnovni pomnilnik in upravljanje z gumbi. Zahvaljujoč tem elementom je Claude lahko interpretiral dogajanje v igri in sprejemal odločitve na podlagi svoje notranje logike.
V prejšnjih modelih, kot je Claude 3.0 Sonnet, je umetna inteligenca Sploh mu ni uspelo zapustiti hiše glavnega junaka.. Vendar pa je v tej novi ponovitvi sistem precej napredoval in uspel premagati Brocka, Mistyja in poročnika Surgea, prve tri Gym Leaders v igri.
Potovanje s 35.000 dejanji v svetu Pokémonov

Claudovo potovanje v Pokémon Red ni bilo enostavno. Po podatkih, ki jih je zagotovil Anthropic, je umetna inteligenca izvedena okoli 35.000 delnic dokler ni uspelo premagati etape Ciudad Carmín. Natančen čas, ki je trajal ta proces, ni bil določen, ampak sposobnost modela, da prilagajati se spremembam in se učiti vzorcev med njihovim nastopom.
Uporaba video iger za ocenjevanje umetne inteligence ni nova. Vendar pa ta poskus krepi idejo, da Ta okolja lahko postanejo temeljna orodja za merjenje napredka pri modelih umetne inteligence, ki so sposobni razmišljati in se prilagajati.
Onstran igre: Claude 3.7 Sonnet in njegove aplikacije v resničnem svetu

Poleg dokazovanja veščin znotraj Pokémon Red je Anthropic poudaril, da je njegov model AI sposoben rešiti zapletene probleme na področjih, kot so matematika, programiranje in kodiranje. Kot del izboljšav je bila dodana funkcija, imenovana Claude Code, ki omogoča AI iskanje in urejanje kode, izvajanje testov in celo delo z orodji, kot je GitHub.
Za tiste, ki jih zanima preizkušanje zmogljivosti modela, je Claude 3.7 Sonnet zdaj na voljo na različnih platformah, vključno z Claudeova aplikacija, Anthropic API, Amazon Bedrock in Google Cloud, ki ohranja enake stroške dostopa kot prejšnja različica.
Dejstvo, da je Claude 3.7 Sonnet uspel premagati ključne stopnje znotraj Pokémon Red, krepi idejo, da Umetna inteligenca z velikimi koraki napreduje v smislu sklepanja in učenja. Tovrstno testiranje odpira vrata do Nove aplikacije v resničnem svetu, od avtomatizacije nalog do reševanja kompleksnih problemov brez človeškega posredovanja.
Sem tehnološki navdušenec, ki je svoja "geek" zanimanja spremenil v poklic. Več kot 10 let svojega življenja sem porabil za uporabo vrhunske tehnologije in premleval najrazličnejše programe iz čiste radovednosti. Zdaj sem se specializiral za računalniško tehnologijo in video igre. To je zato, ker že več kot 5 let pišem za različna spletna mesta o tehnologiji in video igrah ter ustvarjam članke, ki vam želijo dati informacije, ki jih potrebujete, v jeziku, ki je razumljiv vsem.
Če imate kakršna koli vprašanja, moje znanje sega od vsega v zvezi z operacijskim sistemom Windows kot tudi Androidom za mobilne telefone. In moja zaveza je vam, vedno sem pripravljen porabiti nekaj minut in vam pomagati razrešiti kakršna koli vprašanja, ki jih morda imate v tem internetnem svetu.