- Az Anthropic Claude 3.7 Sonnet Pokémon Red játékát tesztelték a Twitchen.
- Az AI-modell jelentős előrelépést tett az érvelés és a döntéshozatal terén.
- Sikerült legyőznie az első három Gym Leadert a játékban, amit a korábbi verziók nem tudtak elérni.
- Az Anthropic kiemeli a videojátékok használatát a mesterséges intelligencia értékelési módszereként.
Az Anthropic meglepte a mesterséges intelligencia világát bemutatva, hogy az új Claude 3.7 Sonnet modell milyen messzire képes bonyolult feladatokban. Ebből az alkalomból és egy innovatív képességteszt részeként Az AI rendszert a Pokémon Red játékra helyezték Rángatózik, ahol a nézők élőben követhették a haladást.
A kísérlet azt kívánja bemutatni, hogy a mesterséges intelligencia mire képes stratégiai döntéseket hozni és megtanuljon eligazodni egy dinamikus környezetben emberi beavatkozás nélkül. Ez mérföldkövet jelent a modell korábbi verzióihoz képest, amelyek nem tudták legyőzni a játékon belüli korai akadályokat.
A Claude 3.7 Sonnet az érvelés fejlődését mutatja be

Az AI-modell fejlesztéseinek értékeléséhez az Anthropic bizonyos kulcsfontosságú eszközöket biztosított: Kijelző pixel bemenet, alap memória és gombvezérlés. Ezeknek az elemeknek köszönhetően Claude képes volt értelmezni a játékban zajló eseményeket és annak belső logikája alapján döntéseket hozni.
A korábbi modellekben, mint például a Claude 3.0 Sonnet, mesterséges intelligencia Még a főszereplő házát sem sikerült elhagynia.. Ebben az új iterációban azonban a rendszer jelentősen fejlődött, és sikerült legyőznie Brockot, Mistyt és Lt. Surge-t, a játék első három edzőtermi vezetőjét.
35.000 XNUMX akcióból álló utazás a Pokémon világban

Claude útja a Pokémon Redben nem volt könnyű. Az Anthropic által szolgáltatott adatok szerint az AI végzett körülbelül 35.000 XNUMX részvény amíg sikerült legyőznie a Ciudad Carmín szakaszt. A folyamat pontos időtartamát nem határozták meg, de a modell képességét nem határozták meg alkalmazkodni a változásokhoz és tanulni mintákat előadásuk során.
A videojátékok használata a mesterséges intelligencia értékelésére nem újdonság. Ez a kísérlet azonban megerősíti azt az elképzelést Ezek a környezetek alapvető eszközökké válhatnak az érvelésre és alkalmazkodásra képes AI-modellek fejlődésének mérésére.
A játékon túl: Claude 3.7 Sonnet és valós alkalmazásai

Amellett, hogy a Pokémon Redben mutatta be képességeit, az Anthropic kiemelte, hogy mesterséges intelligencia modellje képes erre összetett problémákat megoldani olyan területeken, mint a matematika, a programozás és a kódolás. A fejlesztések részeként hozzáadták a Claude Code nevű funkciót, amely lehetővé teszi a mesterséges intelligencia számára a kód keresését és szerkesztését, tesztek futtatását, és még az olyan eszközökkel való együttműködést is, mint a GitHub.
A modell képességeinek tesztelése iránt érdeklődők számára a Claude 3.7 Sonnet már számos platformon elérhető, így pl. Claude alkalmazás, Anthropic API, Amazon Bedrock és Google Cloud, fenntartva az előző verzióval azonos hozzáférési költséget.
Az a tény, hogy a Claude 3.7 Sonnetnek sikerült legyőznie a Pokémon Red kulcsfontosságú szakaszait, megerősíti azt az elképzelést, A mesterséges intelligencia ugrásszerűen fejlődik az érvelés és a tanulás terén. Ez a fajta tesztelés megnyitja az ajtót Új valós alkalmazások, a feladatok automatizálásától az összetett problémák emberi beavatkozás nélküli megoldásáig.
Technológia-rajongó vagyok, aki "geek" érdeklődését szakmává változtatta. Életemből több mint 10 évet töltöttem a legmodernebb technológiával, és pusztán kíváncsiságból mindenféle programmal bütykölgettem. Most a számítástechnikára és a videojátékokra szakosodtam. Ennek az az oka, hogy több mint 5 éve írok különféle technológiával és videojátékokkal foglalkozó weboldalakra, olyan cikkeket készítve, amelyek mindenki számára érthető nyelven igyekeznek megadni a szükséges információkat.
Ha bármilyen kérdése van, tudásom a Windows operációs rendszerrel, valamint a mobiltelefonokhoz készült Androiddal kapcsolatos mindenre kiterjed. És az én elkötelezettségem az Ön iránti elkötelezettségem, mindig készen állok néhány percet rászánni arra, hogy segítsek megoldani minden kérdését ebben az internetes világban.