- Claude 3.7 Sonnet от Anthropic был протестирован в игре Pokémon Red на Twitch.
- Модель ИИ продемонстрировала значительный прогресс в рассуждениях и принятии решений.
- Ему удалось победить первых трех лидеров спортзалов в игре, чего не удавалось добиться в предыдущих версиях.
- Anthropic подчеркивает использование видеоигр в качестве метода оценки искусственного интеллекта.
Anthropic удивил мир искусственного интеллекта продемонстрировав, насколько сложную задачу может выполнить новая модель Claude 3.7 Sonnet. В этом случае, а также в рамках инновационного испытания возможностей, Система искусственного интеллекта была использована для игры в Pokémon Red Twitch, где зрители могли следить за ходом работ в прямом эфире.
Цель эксперимента — показать, как искусственный интеллект может принимать стратегические решения и научиться ориентироваться в динамичной среде без вмешательства человека. Это знаменует собой важную веху по сравнению с предыдущими версиями модели, которым не удалось преодолеть начальные барьеры в игре.
Клод 3.7 Сонет демонстрирует прогресс в рассуждении

Для оценки улучшений модели ИИ компания Anthropic предоставила ей ряд ключевых инструментов: Ввод пикселей дисплея, базовая память и управление кнопками. Благодаря этим элементам Клод мог интерпретировать происходящее в игре и принимать решения на основе ее внутренней логики.
В предыдущих моделях, таких как Claude 3.0 Sonnet, искусственный интеллект Ему даже не удалось покинуть дом главного героя.. Однако в этой новой версии система значительно усовершенствовалась, сумев превзойти Брока, Мисти и лейтенанта Сёрджа, первых трёх лидеров спортзала в игре.
Путешествие из 35.000 XNUMX действий в мире покемонов

Путь Клода в Pokémon Red был нелегким. По данным, предоставленным Anthropic, ИИ выполнил около 35.000 акций пока не удалось преодолеть этап Сьюдад-Кармин. Точное время, которое занял этот процесс, не уточняется, но способность модели адаптироваться к изменениям и изучать закономерности во время их выступления.
Использование видеоигр для оценки искусственного интеллекта не является чем-то новым. Однако этот эксперимент подтверждает идею о том, что Эти среды могут стать основными инструментами для измерения прогресса в моделях ИИ, способных рассуждать и адаптироваться.
За пределами игры: сонет Клода 3.7 и его применение в реальном мире

Помимо демонстрации навыков в Pokémon Red, Anthropic подчеркнула, что ее модель ИИ способна решать сложные проблемы в таких областях, как математика, программирование и кодирование. В рамках усовершенствований была добавлена функция под названием Claude Code, которая позволяет ИИ искать и редактировать код, запускать тесты и даже работать с такими инструментами, как GitHub.
Для тех, кто заинтересован в тестировании возможностей модели, Claude 3.7 Sonnet теперь доступен на различных платформах, включая Приложение Клода, Anthropic API, Amazon Bedrock и Google Cloud, сохранив ту же стоимость доступа, что и в предыдущей версии.
Тот факт, что Клоду 3.7 Соннету удалось преодолеть ключевые этапы в Pokémon Red, подтверждает идею о том, что Искусственный интеллект развивается семимильными шагами в плане рассуждений и обучения. Этот тип тестирования открывает дверь Новые реальные приложения, от автоматизации задач до решения сложных проблем без вмешательства человека.
Я энтузиаст технологий, который превратил свои «компьютерные» интересы в профессию. Я провел более 10 лет своей жизни, используя передовые технологии и возясь со всевозможными программами из чистого любопытства. Сейчас я специализируюсь на компьютерных технологиях и видеоиграх. Это потому, что более 5 лет я пишу статьи для различных сайтов, посвященных технологиям и видеоиграм, создавая статьи, которые стремятся дать вам необходимую информацию на понятном каждому языке.
Если у вас есть какие-либо вопросы, мои знания варьируются от всего, что связано с операционной системой Windows, а также Android для мобильных телефонов. И я предан вам, я всегда готов потратить несколько минут и помочь вам решить любые вопросы, которые могут у вас возникнуть в этом мире Интернета.