Anthropic's AI Claude hraje Pokémona na Twitchi a překvapuje svou schopností uvažování

Poslední aktualizace: 01.02.2024

  • Anthropic's Claude 3.7 Sonnet byl testován při hraní Pokémon Red na Twitchi.
  • Model AI prokázal významný pokrok v uvažování a rozhodování.
  • Podařilo se mu porazit první tři Gym Leaders ve hře, což předchozí verze nedokázaly.
  • Anthropic zdůrazňuje využití videoher jako metody hodnocení umělé inteligence.
Nejkritičtější okamžik Clauda Aie v Pokémonech

Anthropic překvapil svět umělé inteligence předvedením toho, jak daleko může jeho nový model Claude 3.7 Sonnet zajít ve složitých úkolech. Při této příležitosti a jako součást inovativního testu schopností Systém AI byl zaveden pro hraní Pokémon Red Škubnutí, kde mohli diváci sledovat průběh živě.

Experiment se snaží ukázat, jak umělá inteligence umí dělat strategická rozhodnutí a naučit se pohybovat v dynamickém prostředí bez lidského zásahu. To je milník ve srovnání s předchozími verzemi modelu, které nedokázaly překonat počáteční bariéry ve hře.

Exkluzivní obsah – klikněte zde  Jak opravit běžné problémy s ChatGPT

Claude 3.7 Sonnet demonstruje pokroky v uvažování

Claude 3.7 Sonet

Aby bylo možné vyhodnotit vylepšení modelu AI, společnost Anthropic mu poskytla určité klíčové nástroje: Vstup pixelů displeje, základní paměť a ovládání tlačítkem. Díky těmto prvkům byl Claude schopen interpretovat dění ve hře a rozhodovat se na základě její vnitřní logiky.

V předchozích modelech, jako je Claude 3.0 Sonnet, umělá inteligence Ani se mu nepodařilo opustit dům hlavního hrdiny.. V této nové iteraci však systém značně pokročil a podařilo se mu porazit Brocka, Misty a Lt. Surge, první tři Gym Leaders ve hře.

Cesta 35.000 XNUMX akcí ve světě Pokémonů

Claude AI hraje Pokémony

Claudeova cesta v Pokémon Red nebyla jednoduchá. Podle údajů poskytnutých Anthropicem AI popravila přibližně 35 000 akcií dokud se nepodařilo překonat etapu Ciudad Carmín. Nebyla specifikována přesná doba, kterou tento proces zabral, ale schopnost modelu tak učinit přizpůsobit se změnám a naučit se vzorce během jejich vystoupení.

Exkluzivní obsah – klikněte zde  Gamescom Asia x Thailand Game Show: Fúze her, která zachvátila Bangkok

Používání videoher k hodnocení umělé inteligence není nic nového. Tento experiment však posiluje myšlenku, že Tato prostředí se mohou stát základními nástroji měřit pokrok v modelech umělé inteligence schopných uvažovat a přizpůsobovat se.

Mimo hru: Claude 3.7 Sonnet a jeho aplikace v reálném světě

Anthropic představuje Claude 3.7 Sonnet-2

Kromě demonstrování dovedností v rámci Pokémon Red, Anthropic zdůraznil, že jeho model AI je schopen řešení složitých problémů v oborech jako je matematika, programování a kódování. V rámci jeho vylepšení byla přidána funkce nazvaná Claude Code, která umožňuje AI vyhledávat a upravovat kód, spouštět testy a dokonce pracovat s nástroji jako GitHub.

Pro zájemce o testování schopností modelu je nyní Claude 3.7 Sonnet k dispozici na různých platformách, včetně Claude's app, Anthropic API, Amazon Bedrock a Google Cloudse zachováním stejných nákladů na přístup jako u předchozí verze.

Claude 3.7 Sonet
Související článek:
Anthropic představuje Claude 3.7 Sonnet: Hybrid AI s pokročilým uvažováním

Skutečnost, že Claude 3.7 Sonnet dokázal překonat klíčové fáze v rámci Pokémon Red, posiluje myšlenku, že Umělá inteligence postupuje mílovými kroky, pokud jde o uvažování a učení. Tento typ testování otevírá dveře Nové aplikace v reálném světě, od automatizace úkolů až po řešení složitých problémů bez lidského zásahu.

Exkluzivní obsah – klikněte zde  Intergalaktický: Heretický prorok vyvrací zvěsti a určuje směr