Antropo dirbtinis intelektas Claude'as vaidina Pokémoną „Twitch“ tinkle ir stebina savo protavimo sugebėjimais

Paskutiniai pakeitimai: 28/02/2025

  • Anthropic's Claude 3.7 Sonnetas buvo išbandytas žaidžiant Pokémon Red per Twitch.
  • AI modelis pademonstravo didelę pažangą mąstant ir priimant sprendimus.
  • Jam pavyko nugalėti pirmuosius tris sporto salės lyderius žaidime, o to nepavyko pasiekti ankstesnėse versijose.
  • Anthropic pabrėžia vaizdo žaidimų naudojimą kaip dirbtinio intelekto vertinimo metodą.
Svarbiausias Claude'o Ai momentas „Pokémon“.

Antropinis darbas nustebino dirbtinio intelekto pasaulį parodydamas, kaip toli naujasis Claude 3.7 Sonnet modelis gali pasiekti sudėtingas užduotis. Šia proga ir kaip naujoviško pajėgumų išbandymo dalį, AI sistema buvo skirta žaisti Pokémon Red Tampyti, kur žiūrovai galėjo tiesiogiai stebėti eigą.

Eksperimentu siekiama parodyti, kaip dirbtinis intelektas gali priimti strateginius sprendimus ir išmokti naršyti dinamiškoje aplinkoje be žmogaus įsikišimo. Tai yra svarbus etapas, palyginti su ankstesnėmis modelio versijomis, kurioms nepavyko įveikti ankstyvųjų žaidimo kliūčių.

Išskirtinis turinys – spustelėkite čia  Išsamus „Google Veo 3“ naudojimo vadovas: metodai, reikalavimai ir patarimai 2025 m.

Claude 3.7 Sonnetas demonstruoja samprotavimo pažangą

Klodo 3.7 sonetas

Siekdama įvertinti dirbtinio intelekto modelio patobulinimus, „Anthropic“ suteikė jam tam tikrus pagrindinius įrankius: Ekrano pikselių įvestis, pagrindinė atmintis ir mygtukų valdymas. Dėl šių elementų Claude'as galėjo interpretuoti, kas vyksta žaidime, ir priimti sprendimus, remdamasis jo vidine logika.

Ankstesniuose modeliuose, tokiuose kaip Claude 3.0 Sonnet, dirbtinis intelektas Jis net nespėjo išeiti iš pagrindinio veikėjo namų.. Tačiau šioje naujoje iteracijoje sistema gerokai pažengė į priekį ir sugebėjo įveikti Brocką, Misty ir Lt. Surge, pirmuosius tris žaidimo sporto salės lyderius.

35.000 XNUMX veiksmų kelionė pokémonų pasaulyje

Claude AI vaidina Pokémoną

Claude'o kelionė „Pokémon Red“ nebuvo lengva. Remiantis Anthropic pateiktais duomenimis, AI įvykdė apie 35.000 XNUMX akcijų kol pavyko įveikti Ciudad Carmín etapą. Tikslus šio proceso laikas nebuvo nurodytas, tačiau modelio galimybės prisitaikyti prie pokyčių ir mokytis modelių jų pasirodymo metu.

Išskirtinis turinys – spustelėkite čia  „Google Scholar Labs“: taip veikia naujoji dirbtinio intelekto valdoma akademinė paieška

Vaizdo žaidimų naudojimas dirbtiniam intelektui įvertinti nėra naujiena. Tačiau šis eksperimentas sustiprina mintį, kad Šios aplinkos gali tapti pagrindiniais įrankiais įvertinti AI modelių, galinčių samprotauti ir prisitaikyti, pažangą.

Be žaidimo: Claude 3.7 Sonnet ir jo realaus pasaulio programos

Anthropic pristato Claude 3.7 Sonet-2

Be „Pokémon Red“ įgūdžių demonstravimo, „Anthropic“ pabrėžė, kad jos AI modelis yra pajėgus išspręsti sudėtingas problemas tokiose srityse kaip matematika, programavimas ir kodavimas. Tobulinant, buvo pridėta funkcija Claude Code, leidžianti dirbtiniam intelektui ieškoti ir redaguoti kodą, vykdyti testus ir net dirbti su tokiais įrankiais kaip „GitHub“.

Tiems, kurie domisi modelio galimybių išbandymu, Claude 3.7 Sonnet dabar galima įsigyti įvairiose platformose, įskaitant Claude'o programa, Anthropic API, Amazon Bedrock ir Google Cloud, išlaikant tokias pačias prieigos išlaidas kaip ir ankstesnėje versijoje.

Klodo 3.7 sonetas
Susijęs straipsnis:
„Anthropic“ pristato „Claude 3.7 Sonnet: Hybrid AI with Advanced Reasoning“

Tai, kad „Claude 3.7 Sonnet“ sugebėjo įveikti pagrindinius „Pokémon Red“ etapus, sustiprina mintį, kad Dirbtinis intelektas sparčiai tobulėja mąstymo ir mokymosi prasme. Šio tipo bandymai atveria duris Naujos realaus pasaulio programos, nuo užduočių automatizavimo iki sudėtingų problemų sprendimo be žmogaus įsikišimo.

Išskirtinis turinys – spustelėkite čia  Kaip sužinoti savo IQ naudojant tontometrą?