Anthropic-eko AI Claudek Pokémon Twitch-en jokatzen du eta bere arrazonamendu gaitasunarekin harritzen du

Azken eguneratzea: 28/02/2025

  • Anthropic-en Claude 3.7 Sonnet probatu da Twitch-en Pokémon Red jolasten.
  • AI ​​ereduak aurrerapen handia erakutsi du arrazoibidean eta erabakiak hartzen.
  • Jokoko lehen hiru Gym Leaders garaitzea lortu zuen, aurreko bertsioek lortu ez zuten zerbait.
  • Anthropic-ek bideo-jokoak adimen artifizialaren ebaluazio metodo gisa erabiltzea azpimarratzen du.
Claude Ai-ren unerik kritikoena Pokémonen

Anthropic-ek adimen artifizialaren mundua harritu du bere Claude 3.7 Sonnet eredu berriak zeregin konplexuetan noraino irits daitekeen frogatuz. Oraingo honetan, eta gaitasun proba berritzaile baten barruan, AI sistema Pokémon Red-en jolasteko jarri zen twitch, non ikusleek aurrerapena zuzenean jarraitu ahal izan zuten.

Esperimentuak adimen artifiziala nola egin dezakeen erakutsi nahi du erabaki estrategikoak hartzea eta giza esku-hartzerik gabe ingurune dinamiko batean nabigatzen ikasi. Horrek mugarri bat markatzen du ereduaren aurreko bertsioekin alderatuta, jokoaren hasierako oztopoak gainditu ez baitzituen.

Eduki esklusiboa - Egin klik hemen  Google Veo 3 erabiltzeko gida osoa: metodoak, eskakizunak eta aholkuak 2025ean

Claude 3.7 Sonetoak arrazoibidean aurrerapenak erakusten ditu

Claude 3.7 Sonetoa

AI ereduaren hobekuntzak ebaluatzeko, Anthropic-ek funtsezko tresna batzuk eman zizkion: Bistaratu pixelen sarrera, oinarrizko memoria eta botoien kontrola. Elementu horiei esker, Claudek jokoan gertatzen ari zena interpretatu eta bere barne-logikan oinarritutako erabakiak hartu ahal izan zituen.

Aurreko ereduetan, Claude 3.0 Sonnet adibidez, adimen artifiziala Ez zuen pertsonaia nagusiaren etxetik irtetea ere lortu.. Hala ere, errepikapen berri honetan, sistemak dezente aurreratu du, Brock, Misty eta Lt. Surge, jokoko lehen hiru Gym Leaders, irabaztea lortuz.

Pokemon munduan 35.000 ekintzaz osatutako bidaia

Claude AI Pokemon jokatzen du

Claudek Pokémon Red-en egindako bidaia ez zen erraza izan. Anthropic-ek emandako datuen arabera, AI exekutatu egin zen 35.000 akzio inguru Ciudad Carmín etapa gainditzea lortu arte. Prozesu honek behar zuen denbora zehatza ez zen zehaztu, ereduaren gaitasuna baizik aldaketetara egokitu eta ereduak ikasi euren emanaldian zehar.

Eduki esklusiboa - Egin klik hemen  Google Scholar Labs: Horrela funtzionatzen du adimen artifizialaren bidezko bilaketa akademiko berriak

Adimen artifiziala ebaluatzeko bideo-jokoak erabiltzea ez da berria. Hala ere, esperimentu honek ideia indartzen du Ingurune hauek oinarrizko tresna bihur daitezke arrazoitzeko eta egokitzeko gai diren AI ereduen aurrerapenak neurtzeko.

Jolasetik haratago: Claude 3.7 Sonnet eta bere mundu errealeko aplikazioak

Anthropic-ek Claude 3.7 Soneto-2 aurkezten du

Pokémon Red-en trebetasunak erakusteaz gain, Anthropic-ek bere AI eredua gai dela nabarmendu du problema konplexuak ebaztea matematika, programazioa eta kodeketa bezalako arloetan. Bere hobekuntzen baitan, Claude Code izeneko funtzio bat gehitu da, AIri kodea bilatu eta editatzeko, probak egiteko eta GitHub bezalako tresnekin ere lan egiteko aukera ematen diona.

Ereduaren gaitasunak probatzeko interesa dutenentzat, Claude 3.7 Sonnet hainbat plataformatan dago eskuragarri, besteak beste. Claude-ren aplikazioa, Anthropic API, Amazon Bedrock eta Google Cloud, aurreko bertsioaren sarbide-kostu bera mantenduz.

Claude 3.7 Sonetoa
Lotutako artikulua:
Anthropic-ek Claude 3.7 Sonetoa aurkezten du: AI hibridoa arrazoibide aurreratuarekin

Claude 3.7 Sonnet-ek Pokémon Red-en funtsezko etapak gainditzea lortu izanak indartzen du Adimen artifiziala arrazonamenduari eta ikaskuntzari dagokionez jauzi-jauzi egiten ari da. Proba mota honek atea irekitzen du Mundu errealeko aplikazio berriak, zereginak automatizatzetik arazo konplexuak konpontzera, gizakiaren esku-hartzerik gabe.

Eduki esklusiboa - Egin klik hemen  Nola ezagutu nire IQ tontometroarekin?