- Anthropicin Claude 3.7 Sonnettia on testattu pelaamalla Pokémon Rediä Twitchissä.
- AI-malli on osoittanut merkittävää edistystä päättelyssä ja päätöksenteossa.
- Hän onnistui voittamaan pelin kolme ensimmäistä kuntosalijohtajaa, mitä aiemmat versiot eivät onnistuneet saavuttamaan.
- Anthropic korostaa videopelien käyttöä tekoälyn arviointimenetelmänä.
Anthropic on yllättänyt tekoälyn maailman osoittamalla, kuinka pitkälle sen uusi Claude 3.7 Sonet -malli voi mennä monimutkaisissa tehtävissä. Tässä tilaisuudessa ja osana innovatiivista kykytestausta Tekoälyjärjestelmä pantiin pelaamaan Pokémon Rediä Nykiä, jossa katsojat saattoivat seurata edistymistä suorana.
Kokeella pyritään osoittamaan, miten tekoäly voi tehdä strategisia päätöksiä ja oppia navigoimaan dynaamisessa ympäristössä ilman ihmisen puuttumista. Tämä on virstanpylväs verrattuna mallin aikaisempiin versioihin, jotka eivät olleet voineet varhaisia esteitä pelin sisällä.
Claude 3.7 Sonnetti osoittaa edistystä päättelyssä

Arvioidakseen tekoälymallin parannuksia Anthropic toimitti sille tiettyjä tärkeitä työkaluja: Näytön pikselisyöttö, perusmuisti ja painikeohjaus. Näiden elementtien ansiosta Claude pystyi tulkitsemaan mitä pelissä tapahtui ja tekemään päätöksiä sen sisäisen logiikan perusteella.
Aiemmissa malleissa, kuten Claude 3.0 Sonnetissa, tekoäly Hän ei edes onnistunut lähtemään päähenkilön talosta.. Tässä uudessa iteraatiossa järjestelmä on kuitenkin edistynyt huomattavasti, ja se on onnistunut voittamaan Brockin, Mistyn ja Lt. Surgen, pelin kolme ensimmäistä kuntosalijohtajaa.
35.000 XNUMX toiminnan matka Pokémon-maailmassa

Clauden matka Pokémon Redissä ei ollut helppo. Anthropicin toimittamien tietojen mukaan tekoäly teloitti noin 35.000 XNUMX osaketta kunnes onnistui voittamaan Ciudad Carmínin vaiheen. Tarkkaa aikaa tämä prosessi kesti, ei määritelty, mutta mallin kykyä siihen sopeutua muutoksiin ja oppia malleja esityksensä aikana.
Videopelien käyttäminen tekoälyn arvioinnissa ei ole uutta. Tämä kokeilu kuitenkin vahvistaa ajatusta Näistä ympäristöistä voi tulla perustyökaluja mittaamaan edistystä AI-malleissa, jotka pystyvät päättelemään ja mukautumaan.
Pelin lisäksi: Claude 3.7 Sonnet ja sen todelliset sovellukset

Sen lisäksi, että Anthropic on osoittanut taitojaan Pokémon Redissä, se on korostanut, että sen tekoälymalli pystyy ratkaista monimutkaisia ongelmia matematiikan, ohjelmoinnin ja koodauksen aloilla. Osana sen parannuksia on lisätty ominaisuus nimeltä Claude Code, jonka avulla tekoäly voi etsiä ja muokata koodia, suorittaa testejä ja jopa työskennellä GitHubin kaltaisten työkalujen kanssa.
Mallin ominaisuuksien testaamisesta kiinnostuneille Claude 3.7 Sonnet on nyt saatavilla useille alustoille, mukaan lukien Clauden sovellus, Anthropic API, Amazon Bedrock ja Google Cloud, säilyttää samat käyttökustannukset kuin sen edellinen versio.
Se, että Claude 3.7 Sonnet on onnistunut voittamaan Pokémon Redin avainvaiheet, vahvistaa ajatusta, että Tekoäly kehittyy harppauksin päättelyn ja oppimisen suhteen. Tämäntyyppinen testaus avaa oven Uusia reaalimaailman sovelluksiatehtävien automatisoinnista monimutkaisten ongelmien ratkaisemiseen ilman ihmisen puuttumista.
Olen teknologian harrastaja, joka on muuttanut "nörtti"-harrastuksensa ammatiksi. Olen käyttänyt yli 10 vuotta elämästäni uusinta teknologiaa käyttäen ja kaikenlaisten ohjelmien parissa puhtaasta uteliaisuudesta. Nyt olen erikoistunut tietotekniikkaan ja videopeleihin. Tämä johtuu siitä, että yli 5 vuoden ajan olen työskennellyt kirjoittaen useille teknologiaa ja videopelejä käsitteleville verkkosivustoille ja luonut artikkeleita, jotka pyrkivät antamaan sinulle tarvitsemaasi tietoa kielellä, jota kaikki ymmärtävät.
Jos sinulla on kysyttävää, tietoni ulottuu kaikesta Windows-käyttöjärjestelmään liittyvästä sekä matkapuhelimien Androidista. Ja sitoumukseni on sinulle, olen aina valmis käyttämään muutaman minuutin ja auttamaan sinua ratkaisemaan kaikki kysymyksesi, joita sinulla saattaa olla tässä Internet-maailmassa.