Anthropicin tekoäly Claude pelaa Pokémonia Twitchissä ja yllättää päättelykyvyllään

Viimeisin päivitys: 28/02/2025
Kirjoittaja: Alberto navarro

  • Anthropicin Claude 3.7 Sonnettia on testattu pelaamalla Pokémon Rediä Twitchissä.
  • AI-malli on osoittanut merkittävää edistystä päättelyssä ja päätöksenteossa.
  • Hän onnistui voittamaan pelin kolme ensimmäistä kuntosalijohtajaa, mitä aiemmat versiot eivät onnistuneet saavuttamaan.
  • Anthropic korostaa videopelien käyttöä tekoälyn arviointimenetelmänä.
Claude Ain kriittisin hetki Pokémonissa

Anthropic on yllättänyt tekoälyn maailman osoittamalla, kuinka pitkälle sen uusi Claude 3.7 Sonet -malli voi mennä monimutkaisissa tehtävissä. Tässä tilaisuudessa ja osana innovatiivista kykytestausta Tekoälyjärjestelmä pantiin pelaamaan Pokémon Rediä Nykiä, jossa katsojat saattoivat seurata edistymistä suorana.

Kokeella pyritään osoittamaan, miten tekoäly voi tehdä strategisia päätöksiä ja oppia navigoimaan dynaamisessa ympäristössä ilman ihmisen puuttumista. Tämä on virstanpylväs verrattuna mallin aikaisempiin versioihin, jotka eivät olleet voineet varhaisia ​​esteitä pelin sisällä.

Ainutlaatuinen sisältö - Napsauta tästä  Jason Momoa paljastaa uusia yksityiskohtia roolistaan ​​Lobona DCU:ssa.

Claude 3.7 Sonnetti osoittaa edistystä päättelyssä

Claude 3.7 sonetti

Arvioidakseen tekoälymallin parannuksia Anthropic toimitti sille tiettyjä tärkeitä työkaluja: Näytön pikselisyöttö, perusmuisti ja painikeohjaus. Näiden elementtien ansiosta Claude pystyi tulkitsemaan mitä pelissä tapahtui ja tekemään päätöksiä sen sisäisen logiikan perusteella.

Aiemmissa malleissa, kuten Claude 3.0 Sonnetissa, tekoäly Hän ei edes onnistunut lähtemään päähenkilön talosta.. Tässä uudessa iteraatiossa järjestelmä on kuitenkin edistynyt huomattavasti, ja se on onnistunut voittamaan Brockin, Mistyn ja Lt. Surgen, pelin kolme ensimmäistä kuntosalijohtajaa.

35.000 XNUMX toiminnan matka Pokémon-maailmassa

Claude AI pelaa Pokémonia

Clauden matka Pokémon Redissä ei ollut helppo. Anthropicin toimittamien tietojen mukaan tekoäly teloitti noin 35.000 XNUMX osaketta kunnes onnistui voittamaan Ciudad Carmínin vaiheen. Tarkkaa aikaa tämä prosessi kesti, ei määritelty, mutta mallin kykyä siihen sopeutua muutoksiin ja oppia malleja esityksensä aikana.

Ainutlaatuinen sisältö - Napsauta tästä  Windows 11 Agentic AI: Autonomisen tekoälyn tulevaisuus on saapunut tietokoneellesi.

Videopelien käyttäminen tekoälyn arvioinnissa ei ole uutta. Tämä kokeilu kuitenkin vahvistaa ajatusta Näistä ympäristöistä voi tulla perustyökaluja mittaamaan edistystä AI-malleissa, jotka pystyvät päättelemään ja mukautumaan.

Pelin lisäksi: Claude 3.7 Sonnet ja sen todelliset sovellukset

Anthropic esittelee Claude 3.7 Sonnet-2:n

Sen lisäksi, että Anthropic on osoittanut taitojaan Pokémon Redissä, se on korostanut, että sen tekoälymalli pystyy ratkaista monimutkaisia ​​ongelmia matematiikan, ohjelmoinnin ja koodauksen aloilla. Osana sen parannuksia on lisätty ominaisuus nimeltä Claude Code, jonka avulla tekoäly voi etsiä ja muokata koodia, suorittaa testejä ja jopa työskennellä GitHubin kaltaisten työkalujen kanssa.

Mallin ominaisuuksien testaamisesta kiinnostuneille Claude 3.7 Sonnet on nyt saatavilla useille alustoille, mukaan lukien Clauden sovellus, Anthropic API, Amazon Bedrock ja Google Cloud, säilyttää samat käyttökustannukset kuin sen edellinen versio.

Claude 3.7 sonetti
Aiheeseen liittyvä artikkeli:
Anthropic esittelee Claude 3.7 Sonnetin: Hybrid AI edistyneellä päättelyllä

Se, että Claude 3.7 Sonnet on onnistunut voittamaan Pokémon Redin avainvaiheet, vahvistaa ajatusta, että Tekoäly kehittyy harppauksin päättelyn ja oppimisen suhteen. Tämäntyyppinen testaus avaa oven Uusia reaalimaailman sovelluksiatehtävien automatisoinnista monimutkaisten ongelmien ratkaisemiseen ilman ihmisen puuttumista.

Ainutlaatuinen sisältö - Napsauta tästä  MARVEL Cosmic Invasion -demo on nyt saatavilla Steamissa.