Anthropicu tehisintellekt Claude mängib Twitchis Pokémoni ja üllatab oma arutlusvõimega

Viimane uuendus: 28/02/2025

  • Anthropicu Claude 3.7 Sonneti on testitud Twitchis Pokémon Redi mängides.
  • AI-mudel on näidanud märkimisväärseid edusamme arutluskäigus ja otsuste tegemisel.
  • Tal õnnestus mängus alistada kolm esimest jõusaaliliidrit, mida eelmistes versioonides ei õnnestunud saavutada.
  • Anthropic tõstab esile videomängude kasutamise tehisintellekti hindamismeetodina.
Claude Ai kõige kriitilisem hetk Pokémonis

Anthropic on tehisintellekti maailma üllatanud näidates, kui kaugele suudab selle uus Claude 3.7 Sonneti mudel keerulistes ülesannetes jõuda. Sel korral ja osana uuenduslikust võimaluste testist AI-süsteem pandi mängima Pokémon Redi sisse Tõmblema, kus vaatajad said edenemist otseülekandes jälgida.

Eksperimendiga püütakse näidata, kuidas tehisintellekt suudab teha strateegilisi otsuseid ja õppida navigeerima dünaamilises keskkonnas ilma inimese sekkumiseta. See on verstapost võrreldes mudeli eelmiste versioonidega, mis ei suutnud mängu varaseid tõkkeid ületada.

Eksklusiivne sisu – klõpsake siin  Täielik juhend Google Veo 3 kasutamiseks: meetodid, nõuded ja näpunäited 2025. aastal

Claude 3.7 Sonet demonstreerib edusamme arutluskäigus

Claude 3.7 sonett

AI-mudeli täiustuste hindamiseks varustas Anthropic selle teatud võtmetööriistadega: Kuva piksli sisend, põhimälu ja nuppude juhtimine. Tänu nendele elementidele suutis Claude mängus toimuvat tõlgendada ja teha otsuseid selle sisemise loogika alusel.

Varasemates mudelites, näiteks Claude 3.0 Sonnetis, tehisintellekt Ta ei jõudnud isegi peategelase majast lahkuda.. Kuid selles uues iteratsioonis on süsteem märkimisväärselt edasi arenenud, suutis võita Brocki, Mistyt ja Lt. Surge'i, kes on mängu kolm esimest jõusaaliliidrit.

35.000 XNUMX toimingust koosnev teekond Pokémoni maailmas

Claude AI mängib Pokémoni

Claude'i teekond Pokémon Redis ei olnud kerge. Vastavalt Anthropicu esitatud andmetele hukkas AI umbes 35.000 XNUMX aktsiat kuni õnnestus ületada Ciudad Carmini etapp. Selle protsessi täpset aega ei täpsustatud, kuid mudeli võimet ei täpsustatud kohaneda muutustega ja õppida mustreid nende esinemise ajal.

Eksklusiivne sisu – klõpsake siin  Google Scholar Labs: Nii töötab uus tehisintellektil põhinev akadeemiline otsing

Videomängude kasutamine tehisintellekti hindamiseks pole uus asi. See eksperiment kinnitab aga ideed, et Need keskkonnad võivad saada põhilisteks tööriistadeks mõõta edusamme AI mudelites, mis on võimelised mõtlema ja kohanema.

Lisaks mängule: Claude 3.7 Sonnet ja selle reaalmaailma rakendused

Anthropic esitleb Claude 3.7 Sonet-2

Lisaks Pokémon Redis oskuste demonstreerimisele on Anthropic rõhutanud, et tema AI-mudel on selleks võimeline lahendada keerulisi probleeme sellistes valdkondades nagu matemaatika, programmeerimine ja kodeerimine. Selle täiustuste osana on lisatud funktsioon nimega Claude Code, mis võimaldab AI-l otsida ja redigeerida koodi, käivitada teste ja isegi töötada selliste tööriistadega nagu GitHub.

Neile, kes on huvitatud mudeli võimaluste testimisest, on Claude 3.7 Sonnet nüüd saadaval erinevatel platvormidel, sealhulgas Claude'i rakendus, Anthropic API, Amazon Bedrock ja Google Cloud, säilitades eelmise versiooniga sama juurdepääsutasu.

Claude 3.7 sonett
Seotud artikkel:
Anthropic tutvustab Claude 3.7 sonetti: täiustatud arutluskäiguga hübriid-AI

Asjaolu, et Claude 3.7 Sonet on suutnud Pokémon Redi põhietapid ületada, kinnitab ideed, et Tehisintellekt areneb arutlemise ja õppimise osas hüppeliselt. Seda tüüpi testimine avab ukse Uued reaalmaailma rakendused, alates ülesannete automatiseerimisest kuni keerukate probleemide lahendamiseni ilma inimese sekkumiseta.

Eksklusiivne sisu – klõpsake siin  Kuidas tontomeetriga oma IQ-d teada saada?