- Сонетот Клод 3.7 на Антропик е тестиран како игра Покемон Ред на Твич.
- Моделот на вештачка интелигенција покажа значителен напредок во расудувањето и донесувањето одлуки.
- Тој успеа да ги победи првите тројца Gym Leaders во играта, нешто што претходните верзии не успеаја да го постигнат.
- Anthropic ја нагласува употребата на видео игри како метод за евалуација на вештачката интелигенција.
Anthropic го изненади светот на вештачката интелигенција со тоа што ќе покаже колку далеку може да оди неговиот нов модел Claude 3.7 Sonnet во сложени задачи. Во оваа прилика и како дел од иновативниот тест на способности, Системот за вештачка интелигенција беше ставен да игра Покемон Ред Грч, каде што гледачите можеа да го следат напредокот во живо.
Експериментот се обидува да покаже како вештачката интелигенција може донесуваат стратешки одлуки и научете да се движите низ динамична средина без човечка интервенција. Ова претставува пресвртница во споредба со претходните верзии на моделот, кои не успеаја да ги надминат раните бариери во играта.
Клод 3.7 Сонет покажува напредок во расудувањето

За да ги оцени подобрувањата на моделот со вештачка интелигенција, Anthropic му обезбеди одредени клучни алатки: Прикажи влез на пиксели, основна меморија и контрола на копчињата. Благодарение на овие елементи, Клод можеше да протолкува што се случува во играта и да донесува одлуки врз основа на нејзината внатрешна логика.
Во претходните модели, како што е сонетот Клод 3.0, вештачката интелигенција Не успеал ни да ја напушти куќата на главниот лик.. Сепак, во оваа нова итерација, системот значително напредна, успевајќи да ги победи Брок, Мисти и потполковник Сурџ, првите тројца водачи на салата во играта.
Патување од 35.000 акции во светот на Покемон

Патувањето на Клод во Покемон Ред не беше лесно. Според податоците обезбедени од Антропик, вештачката интелигенција е извршена околу 35.000 акции додека не успее да ја надмине етапата Сиудад Кармин. Не беше наведено точното време кое траеше овој процес, туку способноста на моделот да прилагодете се на промените и учите модели за време на нивниот настап.
Користењето видео игри за проценка на вештачката интелигенција не е ново. Меѓутоа, овој експеримент ја зајакнува идејата дека Овие средини можат да станат основни алатки да се измери напредокот во моделите со вештачка интелигенција способни за расудување и прилагодување.
Надвор од играта: Клод 3.7 Сонет и неговите апликации во реалниот свет

Покрај демонстрацијата на вештините во рамките на Покемон Ред, Антропик истакна дека неговиот модел со вештачка интелигенција е способен да решаваат сложени проблеми во области како што се математика, програмирање и кодирање. Како дел од неговите подобрувања, додадена е функција наречена Claude Code, која овозможува AI да пребарува и уредува код, да извршува тестови, па дури и да работи со алатки како GitHub.
За оние кои се заинтересирани да ги тестираат можностите на моделот, Claude 3.7 Sonnet сега е достапен на различни платформи, вклучувајќи Апликацијата на Клод, Anthropic API, Amazon Bedrock и Google Cloud, одржувајќи ги истите трошоци за пристап како претходната верзија.
Фактот дека Клод 3.7 Сонет успеа да ги надмине клучните фази во Покемон Ред ја зајакнува идејата дека Вештачката интелигенција напредува со скокови и граници во однос на расудувањето и учењето. Овој тип на тестирање ја отвора вратата кон Нови апликации од реалниот свет, од автоматизирање задачи до решавање на сложени проблеми без човечка интервенција.
Јас сум технолошки ентузијаст кој своите „гикови“ интереси ги претвори во професија. Поминав повеќе од 10 години од мојот живот користејќи најсовремена технологија и непречено со сите видови програми од чиста љубопитност. Сега сум специјализиран за компјутерска технологија и видео игри. Тоа е затоа што повеќе од 5 години пишувам за различни веб-локации за технологија и видео игри, создавајќи статии кои се обидуваат да ви ги дадат потребните информации на јазик што е разбирлив за секого.
Ако имате прашања, моето знаење се движи од се што е поврзано со оперативниот систем Виндоус како и Андроид за мобилни телефони. И мојата посветеност е кон вас, јас сум секогаш подготвен да потрошам неколку минути и да ви помогнам да ги решите сите прашања што може да ги имате во овој интернет свет.