- Anthropic's Claude 3.7 Sonnet bol testovaný pri hraní Pokémon Red na Twitchi.
- Model AI preukázal významný pokrok v uvažovaní a rozhodovaní.
- Podarilo sa mu poraziť prvých troch Gym Leaders v hre, čo predchádzajúce verzie nedokázali dosiahnuť.
- Anthropic zdôrazňuje využitie videohier ako metódy hodnotenia umelej inteligencie.
Antropic prekvapil svet umelej inteligencie predvedením toho, ako ďaleko môže jeho nový model Claude 3.7 Sonnet zájsť v zložitých úlohách. Pri tejto príležitosti a ako súčasť inovatívneho testu schopností, Systém AI bol navrhnutý na hranie Pokémon Red Twitch, kde mohli diváci sledovať priebeh naživo.
Experiment sa snaží ukázať, ako dokáže umelá inteligencia robiť strategické rozhodnutia a naučiť sa orientovať v dynamickom prostredí bez ľudského zásahu. Toto je míľnik v porovnaní s predchádzajúcimi verziami modelu, ktoré nedokázali prekonať skoré bariéry v hre.
Claude 3.7 Sonnet demonštruje pokroky v uvažovaní

Na vyhodnotenie vylepšení modelu AI mu spoločnosť Anthropic poskytla určité kľúčové nástroje: Vstup pixelov displeja, základná pamäť a ovládanie tlačidlom. Vďaka týmto prvkom dokázal Claude interpretovať dianie v hre a rozhodovať sa na základe jej vnútornej logiky.
V predchádzajúcich modeloch, ako napríklad Claude 3.0 Sonnet, umelá inteligencia Nestihol ani vyjsť z domu hlavnej postavy.. Avšak v tejto novej iterácii systém značne pokročil a podarilo sa mu poraziť Brocka, Misty a Lt. Surgea, prvých troch Gym Leaders v hre.
Cesta 35.000 XNUMX akcií v rámci sveta Pokémonov

Claudeova cesta v Pokémon Red nebola jednoduchá. Podľa údajov poskytnutých spoločnosťou Anthropic bola AI popravená alrededor de 35.000 acciones kým sa mu podarilo prekonať etapu Ciudad Carmín. Presný čas tohto procesu nebol špecifikovaný, ale schopnosť modelu prispôsobiť sa zmenám a naučiť sa vzorce počas ich vystúpenia.
Používanie videohier na hodnotenie umelej inteligencie nie je novinkou. Tento experiment však posilňuje myšlienku, že Tieto prostredia sa môžu stať základnými nástrojmi na meranie pokroku v modeloch AI schopných uvažovať a prispôsobovať sa.
Okrem hry: Claude 3.7 Sonnet a jeho aplikácie v reálnom svete

Okrem demonštrácie zručností v rámci Pokémon Red, Anthropic zdôraznil, že jeho model AI je schopný resolver problemas complejos v oblastiach ako matematika, programovanie a kódovanie. V rámci jeho vylepšení bola pridaná funkcia s názvom Claude Code, ktorá umožňuje AI vyhľadávať a upravovať kód, spúšťať testy a dokonca pracovať s nástrojmi ako GitHub.
Pre záujemcov o testovanie schopností modelu je teraz Claude 3.7 Sonnet dostupný na rôznych platformách, vrátane Claude's app, Anthropic API, Amazon Bedrock a Google Cloud, pričom si zachováva rovnaké náklady na prístup ako v predchádzajúcej verzii.
Skutočnosť, že Claude 3.7 Sonnet dokázal prekonať kľúčové fázy v rámci Pokémon Red, posilňuje myšlienku, že Umelá inteligencia v uvažovaní a učení napreduje míľovými krokmi. Tento typ testovania otvára dvere Nové aplikácie v reálnom svete, od automatizácie úloh až po riešenie zložitých problémov bez ľudského zásahu.
Som technologický nadšenec, ktorý zo svojich „geekovských“ záujmov urobil povolanie. Strávil som viac ako 10 rokov svojho života používaním špičkových technológií a hraním so všetkými druhmi programov z čistej zvedavosti. Teraz som sa špecializoval na počítačovú techniku a videohry. Je to preto, že už viac ako 5 rokov píšem pre rôzne webové stránky o technológiách a videohrách a vytváram články, ktoré sa snažia poskytnúť vám potrebné informácie v jazyku, ktorý je zrozumiteľný pre každého.
Ak máte nejaké otázky, moje znalosti siahajú od všetkého, čo súvisí s operačným systémom Windows, ako aj Androidom pre mobilné telefóny. A môj záväzok je voči vám, vždy som ochotný venovať pár minút a pomôcť vám vyriešiť akékoľvek otázky, ktoré môžete mať v tomto internetovom svete.