Искусственный интеллект Клода от Anthropic играет в Pokémon на Twitch и удивляет своими способностями к рассуждению

Последнее обновление: 28/02/2025

  • Claude 3.7 Sonnet от Anthropic был протестирован в игре Pokémon Red на Twitch.
  • Модель ИИ продемонстрировала значительный прогресс в рассуждениях и принятии решений.
  • Ему удалось победить первых трех лидеров спортзалов в игре, чего не удавалось добиться в предыдущих версиях.
  • Anthropic подчеркивает использование видеоигр в качестве метода оценки искусственного интеллекта.
Самый критический момент Клода Ай в Pokémon

Anthropic удивил мир искусственного интеллекта продемонстрировав, насколько сложную задачу может выполнить новая модель Claude 3.7 Sonnet. В этом случае, а также в рамках инновационного испытания возможностей, Система искусственного интеллекта была использована для игры в Pokémon Red Twitch, где зрители могли следить за ходом работ в прямом эфире.

Цель эксперимента — показать, как искусственный интеллект может принимать стратегические решения и научиться ориентироваться в динамичной среде без вмешательства человека. Это знаменует собой важную веху по сравнению с предыдущими версиями модели, которым не удалось преодолеть начальные барьеры в игре.

Эксклюзивный контент – нажмите здесь  Джейсон Момоа раскрывает новые подробности о своей роли Лобо в киновселенной DC.

Клод 3.7 Сонет демонстрирует прогресс в рассуждении

Клод 3.7 Сонет

Для оценки улучшений модели ИИ компания Anthropic предоставила ей ряд ключевых инструментов: Ввод пикселей дисплея, базовая память и управление кнопками. Благодаря этим элементам Клод мог интерпретировать происходящее в игре и принимать решения на основе ее внутренней логики.

В предыдущих моделях, таких как Claude 3.0 Sonnet, искусственный интеллект Ему даже не удалось покинуть дом главного героя.. Однако в этой новой версии система значительно усовершенствовалась, сумев превзойти Брока, Мисти и лейтенанта Сёрджа, первых трёх лидеров спортзала в игре.

Путешествие из 35.000 XNUMX действий в мире покемонов

Клод ИИ играет в покемонов

Путь Клода в Pokémon Red был нелегким. По данным, предоставленным Anthropic, ИИ выполнил около 35.000 акций пока не удалось преодолеть этап Сьюдад-Кармин. Точное время, которое занял этот процесс, не уточняется, но способность модели адаптироваться к изменениям и изучать закономерности во время их выступления.

Эксклюзивный контент – нажмите здесь  Windows 11 Agentic AI: будущее автономного искусственного интеллекта уже на вашем ПК.

Использование видеоигр для оценки искусственного интеллекта не является чем-то новым. Однако этот эксперимент подтверждает идею о том, что Эти среды могут стать основными инструментами для измерения прогресса в моделях ИИ, способных рассуждать и адаптироваться.

За пределами игры: сонет Клода 3.7 и его применение в реальном мире

Антропик представляет Клода 3.7 Сонет-2

Помимо демонстрации навыков в Pokémon Red, Anthropic подчеркнула, что ее модель ИИ способна решать сложные проблемы в таких областях, как математика, программирование и кодирование. В рамках усовершенствований была добавлена ​​функция под названием Claude Code, которая позволяет ИИ искать и редактировать код, запускать тесты и даже работать с такими инструментами, как GitHub.

Для тех, кто заинтересован в тестировании возможностей модели, Claude 3.7 Sonnet теперь доступен на различных платформах, включая Приложение Клода, Anthropic API, Amazon Bedrock и Google Cloud, сохранив ту же стоимость доступа, что и в предыдущей версии.

Клод 3.7 Сонет
Теме статьи:
Anthropic представляет Claude 3.7 Sonnet: гибридный ИИ с расширенными возможностями рассуждения

Тот факт, что Клоду 3.7 Соннету удалось преодолеть ключевые этапы в Pokémon Red, подтверждает идею о том, что Искусственный интеллект развивается семимильными шагами в плане рассуждений и обучения. Этот тип тестирования открывает дверь Новые реальные приложения, от автоматизации задач до решения сложных проблем без вмешательства человека.

Эксклюзивный контент – нажмите здесь  Демоверсия MARVEL Cosmic Invasion уже доступна в Steam.