- Anthropic's Claude 3.7 Sonnet byl testován při hraní Pokémon Red na Twitchi.
- Model AI prokázal významný pokrok v uvažování a rozhodování.
- Podařilo se mu porazit první tři Gym Leaders ve hře, což předchozí verze nedokázaly.
- Anthropic zdůrazňuje využití videoher jako metody hodnocení umělé inteligence.
Anthropic překvapil svět umělé inteligence předvedením toho, jak daleko může jeho nový model Claude 3.7 Sonnet zajít ve složitých úkolech. Při této příležitosti a jako součást inovativního testu schopností Systém AI byl zaveden pro hraní Pokémon Red Škubnutí, kde mohli diváci sledovat průběh živě.
Experiment se snaží ukázat, jak umělá inteligence umí dělat strategická rozhodnutí a naučit se pohybovat v dynamickém prostředí bez lidského zásahu. To je milník ve srovnání s předchozími verzemi modelu, které nedokázaly překonat počáteční bariéry ve hře.
Claude 3.7 Sonnet demonstruje pokroky v uvažování

Aby bylo možné vyhodnotit vylepšení modelu AI, společnost Anthropic mu poskytla určité klíčové nástroje: Vstup pixelů displeje, základní paměť a ovládání tlačítkem. Díky těmto prvkům byl Claude schopen interpretovat dění ve hře a rozhodovat se na základě její vnitřní logiky.
V předchozích modelech, jako je Claude 3.0 Sonnet, umělá inteligence Ani se mu nepodařilo opustit dům hlavního hrdiny.. V této nové iteraci však systém značně pokročil a podařilo se mu porazit Brocka, Misty a Lt. Surge, první tři Gym Leaders ve hře.
Cesta 35.000 XNUMX akcí ve světě Pokémonů

Claudeova cesta v Pokémon Red nebyla jednoduchá. Podle údajů poskytnutých Anthropicem AI popravila přibližně 35 000 akcií dokud se nepodařilo překonat etapu Ciudad Carmín. Nebyla specifikována přesná doba, kterou tento proces zabral, ale schopnost modelu tak učinit přizpůsobit se změnám a naučit se vzorce během jejich vystoupení.
Používání videoher k hodnocení umělé inteligence není nic nového. Tento experiment však posiluje myšlenku, že Tato prostředí se mohou stát základními nástroji měřit pokrok v modelech umělé inteligence schopných uvažovat a přizpůsobovat se.
Mimo hru: Claude 3.7 Sonnet a jeho aplikace v reálném světě

Kromě demonstrování dovedností v rámci Pokémon Red, Anthropic zdůraznil, že jeho model AI je schopen řešení složitých problémů v oborech jako je matematika, programování a kódování. V rámci jeho vylepšení byla přidána funkce nazvaná Claude Code, která umožňuje AI vyhledávat a upravovat kód, spouštět testy a dokonce pracovat s nástroji jako GitHub.
Pro zájemce o testování schopností modelu je nyní Claude 3.7 Sonnet k dispozici na různých platformách, včetně Claude's app, Anthropic API, Amazon Bedrock a Google Cloudse zachováním stejných nákladů na přístup jako u předchozí verze.
Skutečnost, že Claude 3.7 Sonnet dokázal překonat klíčové fáze v rámci Pokémon Red, posiluje myšlenku, že Umělá inteligence postupuje mílovými kroky, pokud jde o uvažování a učení. Tento typ testování otevírá dveře Nové aplikace v reálném světě, od automatizace úkolů až po řešení složitých problémů bez lidského zásahu.
Jsem technologický nadšenec, který ze svých „geekovských“ zájmů udělal profesi. Strávil jsem více než 10 let svého života používáním nejmodernějších technologií a vrtáním se všemi druhy programů z čisté zvědavosti. Nyní se specializuji na počítačovou techniku a videohry. Je to proto, že již více než 5 let píšu pro různé webové stránky o technologiích a videohrách a tvořím články, které se vám snaží poskytnout informace, které potřebujete, v jazyce, který je srozumitelný všem.
Pokud máte nějaké dotazy, mé znalosti sahají od všeho, co se týká operačního systému Windows a také Androidu pro mobilní telefony. A můj závazek je vůči vám, jsem vždy ochoten strávit pár minut a pomoci vám vyřešit jakékoli otázky, které můžete mít v tomto internetovém světě.