Anthropicov AI Claude igra Pokémona na Twitchu i iznenađuje svojom sposobnošću rasuđivanja

Posljednje ažuriranje: 28/02/2025

  • Anthropicov Claude 3.7 Sonnet je testiran igrajući Pokémon Red na Twitchu.
  • AI model je pokazao značajan napredak u zaključivanju i donošenju odluka.
  • Uspio je pobijediti prva tri Gym Leaders-a u igri, nešto što prethodne verzije nisu uspjele postići.
  • Anthropic ističe korištenje video igrica kao metode procjene umjetne inteligencije.
Najkritičniji trenutak Claudea Aija u Pokémonima

Anthropic je iznenadio svijet umjetne inteligencije demonstrirajući koliko daleko njegov novi Claude 3.7 Sonnet model može ići u složenim zadacima. Ovom prilikom, a u sklopu inovativnog testa sposobnosti, AI sistem je postavljen da igra Pokémon Red Twitch, gdje su gledaoci mogli uživo pratiti napredak.

Eksperiment nastoji pokazati kako umjetna inteligencija može donose strateške odluke i naučite da se krećete u dinamičnom okruženju bez ljudske intervencije. Ovo označava prekretnicu u poređenju sa prethodnim verzijama modela, koji nisu uspeli da prevaziđu rane barijere u igri.

Ekskluzivni sadržaj - kliknite ovdje  Kompletan vodič za korištenje Google Veo 3: Metode, zahtjevi i savjeti 2025

Claude 3.7 Sonet pokazuje napredak u zaključivanju

Claude 3.7 sonet

Kako bi procijenio poboljšanja AI modela, Anthropic mu je dao određene ključne alate: Prikaz unosa piksela, osnovna memorija i kontrola gumba. Zahvaljujući ovim elementima, Klod je mogao da protumači šta se dešava u igri i donosi odluke na osnovu njene unutrašnje logike.

U prethodnim modelima, kao što je Claude 3.0 Sonnet, umjetna inteligencija Nije uspeo ni da napusti kuću glavnog lika.. Međutim, u ovoj novoj iteraciji, sistem je znatno napredovao, uspevši da pobedi Brocka, Mistyja i poručnika Surgea, prva tri lidera teretane u igri.

Putovanje od 35.000 akcija unutar svijeta Pokémona

Claude AI igra Pokémona

Claudeovo putovanje u Pokémon Red nije bilo lako. Prema podacima koje je dao Anthropic, AI je pogubljen oko 35.000 akcija sve dok nije uspio savladati etapu Ciudad Carmína. Tačno vrijeme koje je ovaj proces trajalo nije navedeno, ali sposobnost modela da to učini prilagodite se promjenama i naučite obrasce tokom njihovog nastupa.

Ekskluzivni sadržaj - kliknite ovdje  Google Scholar Labs: Ovako funkcioniše nova akademska pretraga zasnovana na vještačkoj inteligenciji

Korištenje video igrica za procjenu umjetne inteligencije nije novost. Međutim, ovaj eksperiment pojačava ideju da Ova okruženja mogu postati osnovni alati za mjerenje napretka u AI modelima sposobnim za rasuđivanje i prilagođavanje.

Izvan igre: Claude 3.7 Sonnet i njegove primjene u stvarnom svijetu

Anthropic predstavlja Claude 3.7 Sonet-2

Osim što demonstrira vještine unutar Pokémon Reda, Anthropic je naglasio da je njegov AI model sposoban rješavaju složene probleme u oblastima kao što su matematika, programiranje i kodiranje. Kao dio njegovih poboljšanja, dodana je funkcija nazvana Claude Code, koja omogućava AI-u da pretražuje i uređuje kod, pokreće testove, pa čak i rad sa alatima kao što je GitHub.

Za one koji su zainteresovani da testiraju mogućnosti modela, Claude 3.7 Sonnet je sada dostupan na raznim platformama, uključujući Claudeova aplikacija, Anthropic API, Amazon Bedrock i Google Cloud, zadržavajući istu cijenu pristupa kao i prethodna verzija.

Claude 3.7 sonet
Vezani članak:
Anthropic predstavlja Claude 3.7 Sonet: Hibridni AI s naprednim rasuđivanjem

Činjenica da je Claude 3.7 Sonnet uspio prevladati ključne faze unutar Pokémon Reda pojačava ideju da Umjetna inteligencija napreduje skokovima i granicama u smislu zaključivanja i učenja. Ova vrsta testiranja otvara vrata za Nove aplikacije iz stvarnog svijeta, od automatizacije zadataka do rješavanja složenih problema bez ljudske intervencije.

Ekskluzivni sadržaj - kliknite ovdje  Kako saznati svoj IQ pomoću Tontometra?