- Anthropicu Claude 3.7 Sonneti on testitud Twitchis Pokémon Redi mängides.
- AI-mudel on näidanud märkimisväärseid edusamme arutluskäigus ja otsuste tegemisel.
- Tal õnnestus mängus alistada kolm esimest jõusaaliliidrit, mida eelmistes versioonides ei õnnestunud saavutada.
- Anthropic tõstab esile videomängude kasutamise tehisintellekti hindamismeetodina.
Anthropic on tehisintellekti maailma üllatanud näidates, kui kaugele suudab selle uus Claude 3.7 Sonneti mudel keerulistes ülesannetes jõuda. Sel korral ja osana uuenduslikust võimaluste testist AI-süsteem pandi mängima Pokémon Redi sisse Tõmblema, kus vaatajad said edenemist otseülekandes jälgida.
Eksperimendiga püütakse näidata, kuidas tehisintellekt suudab teha strateegilisi otsuseid ja õppida navigeerima dünaamilises keskkonnas ilma inimese sekkumiseta. See on verstapost võrreldes mudeli eelmiste versioonidega, mis ei suutnud mängu varaseid tõkkeid ületada.
Claude 3.7 Sonet demonstreerib edusamme arutluskäigus

AI-mudeli täiustuste hindamiseks varustas Anthropic selle teatud võtmetööriistadega: Kuva piksli sisend, põhimälu ja nuppude juhtimine. Tänu nendele elementidele suutis Claude mängus toimuvat tõlgendada ja teha otsuseid selle sisemise loogika alusel.
Varasemates mudelites, näiteks Claude 3.0 Sonnetis, tehisintellekt Ta ei jõudnud isegi peategelase majast lahkuda.. Kuid selles uues iteratsioonis on süsteem märkimisväärselt edasi arenenud, suutis võita Brocki, Mistyt ja Lt. Surge'i, kes on mängu kolm esimest jõusaaliliidrit.
35.000 XNUMX toimingust koosnev teekond Pokémoni maailmas

Claude'i teekond Pokémon Redis ei olnud kerge. Vastavalt Anthropicu esitatud andmetele hukkas AI umbes 35.000 XNUMX aktsiat kuni õnnestus ületada Ciudad Carmini etapp. Selle protsessi täpset aega ei täpsustatud, kuid mudeli võimet ei täpsustatud kohaneda muutustega ja õppida mustreid nende esinemise ajal.
Videomängude kasutamine tehisintellekti hindamiseks pole uus asi. See eksperiment kinnitab aga ideed, et Need keskkonnad võivad saada põhilisteks tööriistadeks mõõta edusamme AI mudelites, mis on võimelised mõtlema ja kohanema.
Lisaks mängule: Claude 3.7 Sonnet ja selle reaalmaailma rakendused

Lisaks Pokémon Redis oskuste demonstreerimisele on Anthropic rõhutanud, et tema AI-mudel on selleks võimeline lahendada keerulisi probleeme sellistes valdkondades nagu matemaatika, programmeerimine ja kodeerimine. Selle täiustuste osana on lisatud funktsioon nimega Claude Code, mis võimaldab AI-l otsida ja redigeerida koodi, käivitada teste ja isegi töötada selliste tööriistadega nagu GitHub.
Neile, kes on huvitatud mudeli võimaluste testimisest, on Claude 3.7 Sonnet nüüd saadaval erinevatel platvormidel, sealhulgas Claude'i rakendus, Anthropic API, Amazon Bedrock ja Google Cloud, säilitades eelmise versiooniga sama juurdepääsutasu.
Asjaolu, et Claude 3.7 Sonet on suutnud Pokémon Redi põhietapid ületada, kinnitab ideed, et Tehisintellekt areneb arutlemise ja õppimise osas hüppeliselt. Seda tüüpi testimine avab ukse Uued reaalmaailma rakendused, alates ülesannete automatiseerimisest kuni keerukate probleemide lahendamiseni ilma inimese sekkumiseta.
Olen tehnoloogiahuviline, kes on muutnud oma "nohikese" huvidest elukutse. Olen veetnud üle 10 aasta oma elust tipptehnoloogiat kasutades ja puhtast uudishimust igasuguste programmide kallal nokitsenud. Nüüd olen spetsialiseerunud arvutitehnoloogiale ja videomängudele. Seda seetõttu, et rohkem kui 5 aastat olen kirjutanud erinevatele tehnoloogia ja videomängude veebisaitidele, luues artikleid, mille eesmärk on anda teile vajalikku teavet kõigile arusaadavas keeles.
Kui teil on küsimusi, siis minu teadmised ulatuvad kõigest, mis on seotud nii Windowsi operatsioonisüsteemiga kui ka Androidiga mobiiltelefonidele. Ja ma olen pühendunud teile, olen alati nõus kulutama paar minutit ja aitama teil lahendada kõik küsimused, mis teil selles Interneti-maailmas tekkida võivad.