- Anthropic's Claude 3.7 Sonnet Twitch сайтында Pokémon Red ойнау арқылы сынақтан өтті.
- AI моделі пайымдау мен шешім қабылдауда айтарлықтай прогресті көрсетті.
- Ол ойында алғашқы үш спорт залының көшбасшысын жеңе алды, бұған алдыңғы нұсқалар қол жеткізе алмады.
- Anthropic жасанды интеллектті бағалау әдісі ретінде бейне ойындарды пайдалануды атап көрсетеді.
Anthropic жасанды интеллект әлемін таң қалдырды оның жаңа Клод 3.7 Sonnet үлгісі күрделі тапсырмаларды орындауда қаншалықты алысқа бара алатындығын көрсету арқылы. Осы орайда және мүмкіндіктерді инновациялық сынау аясында, AI жүйесі Pokémon Red ойынын ойнауға арналған Twitch, мұнда көрермендер прогресті тікелей бақылай алды.
Эксперимент жасанды интеллект қаншалықты мүмкін екенін көрсетуге тырысады стратегиялық шешімдер қабылдау және адамның араласуынсыз динамикалық ортада шарлауды үйреніңіз. Бұл ойын барысындағы ерте кедергілерді жеңе алмаған модельдің алдыңғы нұсқаларымен салыстырғанда маңызды кезең болып табылады.
Клод 3.7 Сонет пайымдаудағы жетістіктерді көрсетеді

AI моделінің жақсартуларын бағалау үшін Anthropic оны белгілі бір негізгі құралдармен қамтамасыз етті: Дисплей пиксельді енгізу, негізгі жад және түймені басқару. Осы элементтердің арқасында Клод ойында не болып жатқанын түсіндіре алды және оның ішкі логикасына сүйене отырып шешім қабылдай алды.
Алдыңғы үлгілерде, мысалы, Клод 3.0 Sonnet, жасанды интеллект Ол тіпті бас кейіпкердің үйінен де шыға алмады.. Дегенмен, бұл жаңа итерацияда жүйе айтарлықтай алға жылжып, ойындағы алғашқы үш спорт залының көшбасшысы Брок, Мисти және лейтенант Сержді жеңе алды.
Покемон әлеміндегі 35.000 XNUMX әрекеттен тұратын саяхат

Клодтың Покемон Қызылдағы саяхаты оңай болған жоқ. Anthropic ұсынған мәліметтерге сәйкес, AI орындалды шамамен 35.000 XNUMX акция Сьюдад Кармин кезеңін жеңгенше. Бұл процестің нақты уақыты көрсетілмеді, бірақ модельдің мүмкіндігі өзгерістерге бейімделу және үлгілерді үйрену орындау барысында.
Жасанды интеллектті бағалау үшін бейне ойындарды пайдалану жаңалық емес. Дегенмен, бұл эксперимент бұл идеяны күшейтеді Бұл орталар негізгі құралдарға айналуы мүмкін ойлауға және бейімделуге қабілетті AI үлгілеріндегі прогресті өлшеу.
Ойыннан тыс: Claude 3.7 Sonnet және оның нақты әлемдегі қолданбалары

Pokémon Red ішіндегі дағдыларды көрсетуден басқа, Anthropic оның AI моделі қабілетті екенін атап өтті. күрделі мәселелерді шешу математика, бағдарламалау және кодтау сияқты салаларда. Жақсартулардың бір бөлігі ретінде AI-ға кодты іздеуге және өңдеуге, сынақтарды жүргізуге және тіпті GitHub сияқты құралдармен жұмыс істеуге мүмкіндік беретін Клод коды деп аталатын мүмкіндік қосылды.
Модельдің мүмкіндіктерін сынауға қызығушылық танытқандар үшін Claude 3.7 Sonnet қазір әртүрлі платформаларда, соның ішінде Клод қолданбасы, Anthropic API, Amazon Bedrock және Google Cloud, алдыңғы нұсқасымен бірдей қолжетімділік құнын сақтайды.
Клод 3.7 Sonnet Pokémon Red ішіндегі негізгі кезеңдерді жеңе алғаны бұл идеяны нығайтады. Жасанды интеллект пайымдау және оқу тұрғысынан секіріспен алға жылжуда. Бұл сынақ түрі есік ашады Жаңа нақты әлем қолданбалары, тапсырмаларды автоматтандырудан күрделі мәселелерді адамның қатысуынсыз шешуге дейін.
Мен өзінің «геек» қызығушылығын кәсіпке айналдырған технология әуесқойымын. Мен өмірімнің 10 жылдан астам уақытын ең озық технологияны қолданумен және барлық бағдарламалармен таза қызығушылықпен айналысуға арнадым. Қазір мен компьютерлік технологиялар мен бейне ойындарға мамандандым. Себебі, 5 жылдан астам уақыт бойы мен әртүрлі веб-сайттарға технология мен бейне ойындарға арналған мақалалар жазып, сізге қажетті ақпаратты бәріне түсінікті тілде беруге тырысатын мақалалар жасап келемін.
Егер сізде сұрақтар туындаса, менің білімім Windows операциялық жүйесіне, сондай-ақ ұялы телефондарға арналған Android-ге қатысты барлық нәрселерден тұрады. Менің сізге міндеттемемін, мен әрқашан бірнеше минут жұмсауға және осы интернет әлеміндегі кез келген сұрақтарды шешуге көмектесуге дайынмын.