- Anthropicov Claude 3.7 Sonnet je testiran igrajući Pokémon Red na Twitchu.
- AI model pokazao je značajan napredak u razmišljanju i donošenju odluka.
- Uspio je poraziti prva tri Gym Leadersa u igri, nešto što prethodne verzije nisu uspjele postići.
- Anthropic ističe korištenje videoigara kao metode procjene za umjetnu inteligenciju.
Anthropic je iznenadio svijet umjetne inteligencije pokazujući koliko daleko njegov novi model Claude 3.7 Sonnet može ići u složenim zadacima. Ovom prilikom, au sklopu inovativnog testa sposobnosti, Sustav umjetne inteligencije postavljen je za igranje Pokémon Reda Trzaj, gdje su gledatelji uživo mogli pratiti napredak.
Eksperiment nastoji pokazati kako umjetna inteligencija može donositi strateške odluke i naučiti se snalaziti u dinamičnom okruženju bez ljudske intervencije. Ovo označava prekretnicu u usporedbi s prethodnim verzijama modela, koje nisu uspjele prevladati rane prepreke unutar igre.
Claude 3.7 Sonet pokazuje napredak u zaključivanju

Za procjenu poboljšanja AI modela, Anthropic mu je dao određene ključne alate: Unos piksela zaslona, osnovna memorija i kontrola gumba. Zahvaljujući tim elementima, Claude je mogao tumačiti što se događa u igri i donositi odluke na temelju njezine unutarnje logike.
U prethodnim modelima, kao što je Claude 3.0 Sonnet, umjetna inteligencija Nije uspio ni izaći iz kuće glavnog lika.. Međutim, u ovoj novoj iteraciji, sustav je znatno napredovao, uspjevši pobijediti Brocka, Misty i poručnika Surgea, prva tri voditelja teretane u igri.
Putovanje od 35.000 XNUMX radnji unutar Pokémon svijeta

Claudeovo putovanje u Pokémon Redu nije bilo lako. Prema podacima koje je dostavio Anthropic, AI je pogubljen oko 35.000 dionica dok nije uspio savladati etapu Ciudad Carmín. Točno vrijeme koje je ovaj proces trajao nije navedeno, ali sposobnost modela da prilagoditi se promjenama i naučiti obrasce tijekom njihovog nastupa.
Korištenje videoigara za procjenu umjetne inteligencije nije novost. Međutim, ovaj eksperiment pojačava ideju da Ta okruženja mogu postati temeljni alati za mjerenje napretka u modelima umjetne inteligencije koji su sposobni zaključivati i prilagođavati se.
Izvan igre: Claude 3.7 Sonnet i njegove primjene u stvarnom svijetu

Osim demonstracije vještina unutar Pokémon Reda, Anthropic je istaknuo da je njegov AI model sposoban rješavati složene probleme u područjima kao što su matematika, programiranje i kodiranje. Kao dio poboljšanja, dodana je značajka pod nazivom Claude Code, koja AI-ju omogućuje pretraživanje i uređivanje koda, pokretanje testova, pa čak i rad s alatima poput GitHuba.
Za one koji su zainteresirani za testiranje mogućnosti modela, Claude 3.7 Sonnet sada je dostupan na raznim platformama, uključujući Claudeova aplikacija, Anthropic API, Amazon Bedrock i Google Cloud, zadržavajući istu cijenu pristupa kao i prethodna verzija.
Činjenica da je Claude 3.7 Sonnet uspio prevladati ključne faze unutar Pokémon Reda pojačava ideju da Umjetna inteligencija napreduje velikim koracima u smislu razmišljanja i učenja. Ova vrsta testiranja otvara vrata za Nove aplikacije u stvarnom svijetu, od automatizacije zadataka do rješavanja složenih problema bez ljudske intervencije.
Ja sam tehnološki entuzijast koji je svoje "geek" interese pretvorio u profesiju. Proveo sam više od 10 godina svog života koristeći vrhunsku tehnologiju i petljajući sa svim vrstama programa iz čiste znatiželje. Sada sam se specijalizirao za računalne tehnologije i video igre. To je zato što sam više od 5 godina pisao za razne web stranice o tehnologiji i videoigrama, stvarajući članke koji vam nastoje dati informacije koje su vam potrebne na jeziku koji je svima razumljiv.
Ako imate bilo kakvih pitanja, moje znanje seže od svega vezanog uz Windows operativni sustav kao i Android za mobitele. I moja je posvećenost vama, uvijek sam spreman odvojiti nekoliko minuta i pomoći vam riješiti sva pitanja koja imate u ovom internetskom svijetu.