Anthropicov AI Claude igra Pokémona na Twitchu i iznenađuje svojom sposobnošću razmišljanja

Zadnje ažuriranje: 28/02/2025

  • Anthropicov Claude 3.7 Sonnet je testiran igrajući Pokémon Red na Twitchu.
  • AI model pokazao je značajan napredak u razmišljanju i donošenju odluka.
  • Uspio je poraziti prva tri Gym Leadersa u igri, nešto što prethodne verzije nisu uspjele postići.
  • Anthropic ističe korištenje videoigara kao metode procjene za umjetnu inteligenciju.
Najkritičniji trenutak Claudea Aija u Pokémonu

Anthropic je iznenadio svijet umjetne inteligencije pokazujući koliko daleko njegov novi model Claude 3.7 Sonnet može ići u složenim zadacima. Ovom prilikom, au sklopu inovativnog testa sposobnosti, Sustav umjetne inteligencije postavljen je za igranje Pokémon Reda Trzaj, gdje su gledatelji uživo mogli pratiti napredak.

Eksperiment nastoji pokazati kako umjetna inteligencija može donositi strateške odluke i naučiti se snalaziti u dinamičnom okruženju bez ljudske intervencije. Ovo označava prekretnicu u usporedbi s prethodnim verzijama modela, koje nisu uspjele prevladati rane prepreke unutar igre.

Ekskluzivan sadržaj - Kliknite ovdje  Potpuni vodič za korištenje Google Veo 3: Metode, zahtjevi i savjeti 2025

Claude 3.7 Sonet pokazuje napredak u zaključivanju

Claude 3.7 Sonet

Za procjenu poboljšanja AI modela, Anthropic mu je dao određene ključne alate: Unos piksela zaslona, ​​osnovna memorija i kontrola gumba. Zahvaljujući tim elementima, Claude je mogao tumačiti što se događa u igri i donositi odluke na temelju njezine unutarnje logike.

U prethodnim modelima, kao što je Claude 3.0 Sonnet, umjetna inteligencija Nije uspio ni izaći iz kuće glavnog lika.. Međutim, u ovoj novoj iteraciji, sustav je znatno napredovao, uspjevši pobijediti Brocka, Misty i poručnika Surgea, prva tri voditelja teretane u igri.

Putovanje od 35.000 XNUMX radnji unutar Pokémon svijeta

Claude AI igra Pokémone

Claudeovo putovanje u Pokémon Redu nije bilo lako. Prema podacima koje je dostavio Anthropic, AI je pogubljen oko 35.000 dionica dok nije uspio savladati etapu Ciudad Carmín. Točno vrijeme koje je ovaj proces trajao nije navedeno, ali sposobnost modela da prilagoditi se promjenama i naučiti obrasce tijekom njihovog nastupa.

Ekskluzivan sadržaj - Kliknite ovdje  Google Scholar Labs: Ovako funkcionira novo akademsko pretraživanje pokretano umjetnom inteligencijom

Korištenje videoigara za procjenu umjetne inteligencije nije novost. Međutim, ovaj eksperiment pojačava ideju da Ta okruženja mogu postati temeljni alati za mjerenje napretka u modelima umjetne inteligencije koji su sposobni zaključivati ​​i prilagođavati se.

Izvan igre: Claude 3.7 Sonnet i njegove primjene u stvarnom svijetu

Anthropic predstavlja Claude 3.7 Sonnet-2

Osim demonstracije vještina unutar Pokémon Reda, Anthropic je istaknuo da je njegov AI model sposoban rješavati složene probleme u područjima kao što su matematika, programiranje i kodiranje. Kao dio poboljšanja, dodana je značajka pod nazivom Claude Code, koja AI-ju omogućuje pretraživanje i uređivanje koda, pokretanje testova, pa čak i rad s alatima poput GitHuba.

Za one koji su zainteresirani za testiranje mogućnosti modela, Claude 3.7 Sonnet sada je dostupan na raznim platformama, uključujući Claudeova aplikacija, Anthropic API, Amazon Bedrock i Google Cloud, zadržavajući istu cijenu pristupa kao i prethodna verzija.

Claude 3.7 Sonet
Povezani članak:
Anthropic predstavlja Claude 3.7 Sonnet: Hybrid AI with Advanced Reasoning

Činjenica da je Claude 3.7 Sonnet uspio prevladati ključne faze unutar Pokémon Reda pojačava ideju da Umjetna inteligencija napreduje velikim koracima u smislu razmišljanja i učenja. Ova vrsta testiranja otvara vrata za Nove aplikacije u stvarnom svijetu, od automatizacije zadataka do rješavanja složenih problema bez ljudske intervencije.

Ekskluzivan sadržaj - Kliknite ovdje  Kako znati svoj IQ pomoću Tontometra?