Az Anthropic mesterséges intelligenciája, Claude Pokémont játszik a Twitch-en, és meglep érvelési képességével

Utolsó frissítés: 28/02/2025

  • Az Anthropic Claude 3.7 Sonnet Pokémon Red játékát tesztelték a Twitchen.
  • Az AI-modell jelentős előrelépést tett az érvelés és a döntéshozatal terén.
  • Sikerült legyőznie az első három Gym Leadert a játékban, amit a korábbi verziók nem tudtak elérni.
  • Az Anthropic kiemeli a videojátékok használatát a mesterséges intelligencia értékelési módszereként.
Claude Ai legkritikusabb pillanata a Pokémonban

Az Anthropic meglepte a mesterséges intelligencia világát bemutatva, hogy az új Claude 3.7 Sonnet modell milyen messzire képes bonyolult feladatokban. Ebből az alkalomból és egy innovatív képességteszt részeként Az AI rendszert a Pokémon Red játékra helyezték Rángatózik, ahol a nézők élőben követhették a haladást.

A kísérlet azt kívánja bemutatni, hogy a mesterséges intelligencia mire képes stratégiai döntéseket hozni és megtanuljon eligazodni egy dinamikus környezetben emberi beavatkozás nélkül. Ez mérföldkövet jelent a modell korábbi verzióihoz képest, amelyek nem tudták legyőzni a játékon belüli korai akadályokat.

Exkluzív tartalom – Kattintson ide  Teljes útmutató a Google Veo 3 használatához: módszerek, követelmények és tippek 2025

A Claude 3.7 Sonnet az érvelés fejlődését mutatja be

Claude 3.7 szonett

Az AI-modell fejlesztéseinek értékeléséhez az Anthropic bizonyos kulcsfontosságú eszközöket biztosított: Kijelző pixel bemenet, alap memória és gombvezérlés. Ezeknek az elemeknek köszönhetően Claude képes volt értelmezni a játékban zajló eseményeket és annak belső logikája alapján döntéseket hozni.

A korábbi modellekben, mint például a Claude 3.0 Sonnet, mesterséges intelligencia Még a főszereplő házát sem sikerült elhagynia.. Ebben az új iterációban azonban a rendszer jelentősen fejlődött, és sikerült legyőznie Brockot, Mistyt és Lt. Surge-t, a játék első három edzőtermi vezetőjét.

35.000 XNUMX akcióból álló utazás a Pokémon világban

Claude AI Pokémont játszik

Claude útja a Pokémon Redben nem volt könnyű. Az Anthropic által szolgáltatott adatok szerint az AI végzett körülbelül 35.000 XNUMX részvény amíg sikerült legyőznie a Ciudad Carmín szakaszt. A folyamat pontos időtartamát nem határozták meg, de a modell képességét nem határozták meg alkalmazkodni a változásokhoz és tanulni mintákat előadásuk során.

Exkluzív tartalom – Kattintson ide  Google Scholar Labs: Így működik az új, mesterséges intelligencián alapuló akadémiai keresés

A videojátékok használata a mesterséges intelligencia értékelésére nem újdonság. Ez a kísérlet azonban megerősíti azt az elképzelést Ezek a környezetek alapvető eszközökké válhatnak az érvelésre és alkalmazkodásra képes AI-modellek fejlődésének mérésére.

A játékon túl: Claude 3.7 Sonnet és valós alkalmazásai

Az Anthropic bemutatja a Claude 3.7 Sonnet-2-t

Amellett, hogy a Pokémon Redben mutatta be képességeit, az Anthropic kiemelte, hogy mesterséges intelligencia modellje képes erre összetett problémákat megoldani olyan területeken, mint a matematika, a programozás és a kódolás. A fejlesztések részeként hozzáadták a Claude Code nevű funkciót, amely lehetővé teszi a mesterséges intelligencia számára a kód keresését és szerkesztését, tesztek futtatását, és még az olyan eszközökkel való együttműködést is, mint a GitHub.

A modell képességeinek tesztelése iránt érdeklődők számára a Claude 3.7 Sonnet már számos platformon elérhető, így pl. Claude alkalmazás, Anthropic API, Amazon Bedrock és Google Cloud, fenntartva az előző verzióval azonos hozzáférési költséget.

Claude 3.7 szonett
Kapcsolódó cikk:
Az Anthropic bemutatja a Claude 3.7 szonettet: Hibrid AI fejlett érveléssel

Az a tény, hogy a Claude 3.7 Sonnetnek sikerült legyőznie a Pokémon Red kulcsfontosságú szakaszait, megerősíti azt az elképzelést, A mesterséges intelligencia ugrásszerűen fejlődik az érvelés és a tanulás terén. Ez a fajta tesztelés megnyitja az ajtót Új valós alkalmazások, a feladatok automatizálásától az összetett problémák emberi beavatkozás nélküli megoldásáig.

Exkluzív tartalom – Kattintson ide  Hogyan tudhatom meg az IQ-mat a tontométerrel?