- Anthropic-en Claude 3.7 Sonnet probatu da Twitch-en Pokémon Red jolasten.
- AI ereduak aurrerapen handia erakutsi du arrazoibidean eta erabakiak hartzen.
- Jokoko lehen hiru Gym Leaders garaitzea lortu zuen, aurreko bertsioek lortu ez zuten zerbait.
- Anthropic-ek bideo-jokoak adimen artifizialaren ebaluazio metodo gisa erabiltzea azpimarratzen du.
Anthropic-ek adimen artifizialaren mundua harritu du bere Claude 3.7 Sonnet eredu berriak zeregin konplexuetan noraino irits daitekeen frogatuz. Oraingo honetan, eta gaitasun proba berritzaile baten barruan, AI sistema Pokémon Red-en jolasteko jarri zen twitch, non ikusleek aurrerapena zuzenean jarraitu ahal izan zuten.
Esperimentuak adimen artifiziala nola egin dezakeen erakutsi nahi du erabaki estrategikoak hartzea eta giza esku-hartzerik gabe ingurune dinamiko batean nabigatzen ikasi. Horrek mugarri bat markatzen du ereduaren aurreko bertsioekin alderatuta, jokoaren hasierako oztopoak gainditu ez baitzituen.
Claude 3.7 Sonetoak arrazoibidean aurrerapenak erakusten ditu

AI ereduaren hobekuntzak ebaluatzeko, Anthropic-ek funtsezko tresna batzuk eman zizkion: Bistaratu pixelen sarrera, oinarrizko memoria eta botoien kontrola. Elementu horiei esker, Claudek jokoan gertatzen ari zena interpretatu eta bere barne-logikan oinarritutako erabakiak hartu ahal izan zituen.
Aurreko ereduetan, Claude 3.0 Sonnet adibidez, adimen artifiziala Ez zuen pertsonaia nagusiaren etxetik irtetea ere lortu.. Hala ere, errepikapen berri honetan, sistemak dezente aurreratu du, Brock, Misty eta Lt. Surge, jokoko lehen hiru Gym Leaders, irabaztea lortuz.
Pokemon munduan 35.000 ekintzaz osatutako bidaia

Claudek Pokémon Red-en egindako bidaia ez zen erraza izan. Anthropic-ek emandako datuen arabera, AI exekutatu egin zen 35.000 akzio inguru Ciudad Carmín etapa gainditzea lortu arte. Prozesu honek behar zuen denbora zehatza ez zen zehaztu, ereduaren gaitasuna baizik aldaketetara egokitu eta ereduak ikasi euren emanaldian zehar.
Adimen artifiziala ebaluatzeko bideo-jokoak erabiltzea ez da berria. Hala ere, esperimentu honek ideia indartzen du Ingurune hauek oinarrizko tresna bihur daitezke arrazoitzeko eta egokitzeko gai diren AI ereduen aurrerapenak neurtzeko.
Jolasetik haratago: Claude 3.7 Sonnet eta bere mundu errealeko aplikazioak

Pokémon Red-en trebetasunak erakusteaz gain, Anthropic-ek bere AI eredua gai dela nabarmendu du problema konplexuak ebaztea matematika, programazioa eta kodeketa bezalako arloetan. Bere hobekuntzen baitan, Claude Code izeneko funtzio bat gehitu da, AIri kodea bilatu eta editatzeko, probak egiteko eta GitHub bezalako tresnekin ere lan egiteko aukera ematen diona.
Ereduaren gaitasunak probatzeko interesa dutenentzat, Claude 3.7 Sonnet hainbat plataformatan dago eskuragarri, besteak beste. Claude-ren aplikazioa, Anthropic API, Amazon Bedrock eta Google Cloud, aurreko bertsioaren sarbide-kostu bera mantenduz.
Claude 3.7 Sonnet-ek Pokémon Red-en funtsezko etapak gainditzea lortu izanak indartzen du Adimen artifiziala arrazonamenduari eta ikaskuntzari dagokionez jauzi-jauzi egiten ari da. Proba mota honek atea irekitzen du Mundu errealeko aplikazio berriak, zereginak automatizatzetik arazo konplexuak konpontzera, gizakiaren esku-hartzerik gabe.
Bere "geek" interesak lanbide bihurtu dituen teknologia zalea naiz. Nire bizitzako 10 urte baino gehiago eman ditut punta-puntako teknologia erabiltzen eta era guztietako programak moldatzen jakin-min hutsagatik. Orain informatikako teknologian eta bideo-jokoetan espezializatu naiz. Izan ere, 5 urte baino gehiago daramatzadala teknologia eta bideo-jokoen inguruko hainbat webgunetan idazten, denontzat ulergarria den hizkuntza batean behar duzun informazioa eman nahi duten artikuluak sortzen.
Zalantzarik baduzu, nire ezagutza Windows sistema eragilearekin zerikusia duen guztia eta baita telefono mugikorretarako Android ere barne hartzen du. Eta nire konpromisoa zurekin da, beti prest nago minutu batzuk pasatzeko eta Interneteko mundu honetan izan ditzakezun zalantzak konpontzen laguntzeko.