AI Claude на Anthropic играе Pokémon на Twitch и изненадва със способността си да разсъждава

Последна актуализация: 28/02/2025

  • Claude 3.7 Sonnet на Anthropic е тестван при игра на Pokémon Red на Twitch.
  • Моделът на AI демонстрира значителен напредък в разсъжденията и вземането на решения.
  • Той успя да победи първите трима Gym Leaders в играта, нещо, което предишните версии не успяха да постигнат.
  • Anthropic подчертава използването на видеоигрите като метод за оценка на изкуствения интелект.
Най-критичният момент на Claude Ai в Pokémon

Anthropic изненада света на изкуствения интелект като демонстрира колко далеч може да стигне неговият нов модел Claude 3.7 Sonnet в сложни задачи. По този повод и като част от иновативен тест на способностите, AI ​​системата беше поставена за игра на Pokémon Red Twitch, където зрителите можеха да проследят напредъка на живо.

Експериментът цели да покаже как изкуственият интелект може вземат стратегически решения и се научете да се ориентирате в динамична среда без човешка намеса. Това бележи крайъгълен камък в сравнение с предишните версии на модела, които не успяха да преодолеят ранните бариери в играта.

Изключително съдържание - Щракнете тук  Джейсън Момоа разкрива нови подробности за ролята си на Лобо в DCU.

Клауд 3.7 Сонет демонстрира напредък в разсъжденията

Клод 3.7 Сонет

За да оцени подобренията на AI модела, Anthropic му предостави определени ключови инструменти: Пикселно въвеждане на дисплей, основна памет и управление с бутони. Благодарение на тези елементи Клод успя да тълкува какво се случва в играта и да взема решения въз основа на вътрешната си логика.

В предишни модели, като Claude 3.0 Sonnet, изкуственият интелект Той дори не успя да напусне къщата на главния герой.. Въпреки това, в тази нова итерация, системата напредна значително, успявайки да победи Brock, Misty и Lt. Surge, първите трима Gym Leaders в играта.

Пътуване с 35.000 XNUMX действия в света на Pokémon

Claude AI играе Pokémon

Пътуването на Клод в Pokémon Red не беше лесно. Според данни, предоставени от Anthropic, AI е изпълнен около 35.000 XNUMX акции докато успее да преодолее етапа Сиудад Кармин. Точното време, отнело този процес, не беше посочено, но способността на модела да адаптирайте се към промените и научете модели по време на изпълнението им.

Изключително съдържание - Щракнете тук  Windows 11 Agent AI: Бъдещето на автономния изкуствен интелект е пристигнало на вашия компютър.

Използването на видеоигри за оценка на изкуствения интелект не е нещо ново. Този експеримент обаче затвърждава идеята, че Тези среди могат да се превърнат в основни инструменти за измерване на напредъка в AI модели, способни да разсъждават и да се адаптират.

Отвъд играта: Claude 3.7 Sonnet и неговите приложения в реалния свят

Антропик представя Клод 3.7 Сонет-2

В допълнение към демонстрирането на умения в Pokémon Red, Anthropic подчерта, че неговият AI модел е способен на решаване на сложни проблеми в области като математика, програмиране и кодиране. Като част от подобренията е добавена функция, наречена Claude Code, която позволява на AI да търси и редактира код, да изпълнява тестове и дори да работи с инструменти като GitHub.

За тези, които се интересуват от тестване на възможностите на модела, Claude 3.7 Sonnet вече се предлага на различни платформи, включително Приложението на Claude, Anthropic API, Amazon Bedrock и Google Cloud, запазвайки същата цена за достъп като предишната си версия.

Клод 3.7 Сонет
Свързана статия:
Anthropic представя Claude 3.7 Sonnet: Хибриден AI с усъвършенствано разсъждение

Фактът, че Claude 3.7 Sonnet успя да преодолее ключови етапи в рамките на Pokémon Red, засилва идеята, че Изкуственият интелект напредва със скокове и граници по отношение на разсъжденията и ученето. Този тип тестване отваря вратата към Нови реални приложения, от автоматизиране на задачи до решаване на сложни проблеми без човешка намеса.

Изключително съдържание - Щракнете тук  Демото на MARVEL Cosmic Invasion вече е достъпно в Steam.