Anthropic's AI Claude hrá Pokémona na Twitchi a prekvapuje svojou schopnosťou uvažovania

Posledná aktualizácia: 01.02.2024

  • Anthropic's Claude 3.7 Sonnet bol testovaný pri hraní Pokémon Red na Twitchi.
  • Model AI preukázal významný pokrok v uvažovaní a rozhodovaní.
  • Podarilo sa mu poraziť prvých troch Gym Leaders v hre, čo predchádzajúce verzie nedokázali dosiahnuť.
  • Anthropic zdôrazňuje využitie videohier ako metódy hodnotenia umelej inteligencie.
Najkritickejší moment Clauda Ai v Pokémonoch

Antropic prekvapil svet umelej inteligencie predvedením toho, ako ďaleko môže jeho nový model Claude 3.7 Sonnet zájsť v zložitých úlohách. Pri tejto príležitosti a ako súčasť inovatívneho testu schopností, Systém AI bol navrhnutý na hranie Pokémon Red Twitch, kde mohli diváci sledovať priebeh naživo.

Experiment sa snaží ukázať, ako dokáže umelá inteligencia robiť strategické rozhodnutia a naučiť sa orientovať v dynamickom prostredí bez ľudského zásahu. Toto je míľnik v porovnaní s predchádzajúcimi verziami modelu, ktoré nedokázali prekonať skoré bariéry v hre.

Exkluzívny obsah – kliknite sem  Spotify sa integruje s ChatGPT: takto to funguje a čo môžete robiť

Claude 3.7 Sonnet demonštruje pokroky v uvažovaní

Claude 3.7 Sonet

Na vyhodnotenie vylepšení modelu AI mu spoločnosť Anthropic poskytla určité kľúčové nástroje: Vstup pixelov displeja, základná pamäť a ovládanie tlačidlom. Vďaka týmto prvkom dokázal Claude interpretovať dianie v hre a rozhodovať sa na základe jej vnútornej logiky.

V predchádzajúcich modeloch, ako napríklad Claude 3.0 Sonnet, umelá inteligencia Nestihol ani vyjsť z domu hlavnej postavy.. Avšak v tejto novej iterácii systém značne pokročil a podarilo sa mu poraziť Brocka, Misty a Lt. Surgea, prvých troch Gym Leaders v hre.

Cesta 35.000 XNUMX akcií v rámci sveta Pokémonov

Claude AI hrá Pokémonov

Claudeova cesta v Pokémon Red nebola jednoduchá. Podľa údajov poskytnutých spoločnosťou Anthropic bola AI ​​popravená alrededor de 35.000 acciones kým sa mu podarilo prekonať etapu Ciudad Carmín. Presný čas tohto procesu nebol špecifikovaný, ale schopnosť modelu prispôsobiť sa zmenám a naučiť sa vzorce počas ich vystúpenia.

Exkluzívny obsah – kliknite sem  Toto je MAI-Image-1, model umelej inteligencie, s ktorým Microsoft konkuruje spoločnosti Midjourney.

Používanie videohier na hodnotenie umelej inteligencie nie je novinkou. Tento experiment však posilňuje myšlienku, že Tieto prostredia sa môžu stať základnými nástrojmi na meranie pokroku v modeloch AI schopných uvažovať a prispôsobovať sa.

Okrem hry: Claude 3.7 Sonnet a jeho aplikácie v reálnom svete

Anthropic predstavuje Claude 3.7 Sonnet-2

Okrem demonštrácie zručností v rámci Pokémon Red, Anthropic zdôraznil, že jeho model AI je schopný resolver problemas complejos v oblastiach ako matematika, programovanie a kódovanie. V rámci jeho vylepšení bola pridaná funkcia s názvom Claude Code, ktorá umožňuje AI vyhľadávať a upravovať kód, spúšťať testy a dokonca pracovať s nástrojmi ako GitHub.

Pre záujemcov o testovanie schopností modelu je teraz Claude 3.7 Sonnet dostupný na rôznych platformách, vrátane Claude's app, Anthropic API, Amazon Bedrock a Google Cloud, pričom si zachováva rovnaké náklady na prístup ako v predchádzajúcej verzii.

Claude 3.7 Sonet
Súvisiaci článok:
Anthropic predstavuje Claude 3.7 Sonnet: Hybrid AI s pokročilým uvažovaním

Skutočnosť, že Claude 3.7 Sonnet dokázal prekonať kľúčové fázy v rámci Pokémon Red, posilňuje myšlienku, že Umelá inteligencia v uvažovaní a učení napreduje míľovými krokmi. Tento typ testovania otvára dvere Nové aplikácie v reálnom svete, od automatizácie úloh až po riešenie zložitých problémov bez ľudského zásahu.

Exkluzívny obsah – kliknite sem  Google spúšťa SynthID Detector: svoj nástroj na určenie, či bol obrázok, text alebo video vytvorený pomocou umelej inteligencie.