ШІ Клод з Anthropic грає в покемонів на Twitch і дивує своєю здатністю міркувати

Останнє оновлення: 28/02/2025

  • Claude 3.7 Sonnet від Anthropic протестовано під час гри в Pokémon Red на Twitch.
  • Модель AI продемонструвала значний прогрес у міркуванні та прийнятті рішень.
  • Йому вдалося перемогти перших трьох Gym Leaders у грі, чого не вдалося досягти попереднім версіям.
  • Anthropic підкреслює використання відеоігор як методу оцінки штучного інтелекту.
Найважчий момент Клода Ая в Pokémon

Компанія Anthropic здивувала світ штучного інтелекту демонструючи, як далеко може зайти його нова модель Claude 3.7 Sonnet у складних завданнях. З цієї нагоди та в рамках інноваційного тестування можливостей, Система AI була використана для гри в Pokémon Red Сіпатися, де глядачі могли стежити за ходом у прямому ефірі.

Експеримент прагне показати, як штучний інтелект може приймати стратегічні рішення і навчитися орієнтуватися в динамічному середовищі без втручання людини. Це знаменує собою віху в порівнянні з попередніми версіями моделі, яким не вдалося подолати перші бар’єри в грі.

Ексклюзивний вміст - натисніть тут  Повний посібник з використання Google Veo 3: методи, вимоги та поради 2025

Клод 3.7 Сонет демонструє прогрес у міркуванні

Клод 3.7 Сонет

Щоб оцінити вдосконалення моделі штучного інтелекту, Anthropic надав їй певні ключові інструменти: Введення пікселів на дисплеї, основна пам'ять і керування кнопками. Завдяки цим елементам Клод зміг інтерпретувати те, що відбувається в грі, і приймати рішення, виходячи з її внутрішньої логіки.

У попередніх моделях, таких як Claude 3.0 Sonnet, штучний інтелект Він навіть не встиг вийти з дому головного героя.. Однак у цій новій ітерації система значно просунулася вперед, зумівши перемогти Брока, Місті та лейтенанта Серджа, перших трьох лідерів тренажерних залів у грі.

Подорож із 35.000 XNUMX дій у світі покемонів

Клод ШІ грає в покемонів

Подорож Клода в Pokémon Red була непростою. Згідно з даними, наданими Anthropic, ШІ страчено близько 35.000 XNUMX акцій поки не вдалося подолати етап Сьюдад-Кармін. Точний час, який зайняв цей процес, не вказано, але здатність моделі адаптуватися до змін і вивчати шаблони під час їх виконання.

Ексклюзивний вміст - натисніть тут  Лабораторії Google Scholar: Ось як працює новий академічний пошук на базі штучного інтелекту

Використання відеоігор для оцінки штучного інтелекту не є новим. Однак цей експеримент підтверджує цю думку Ці середовища можуть стати основними інструментами для вимірювання прогресу в моделях ШІ, здатних міркувати та адаптуватися.

За межами гри: Claude 3.7 Sonnet і його реальні програми

Антропік представляє Клода 3.7 Сонет-2

На додаток до демонстрації навичок у Pokémon Red, Anthropic підкреслив, що його модель AI здатна вирішувати складні проблеми у таких галузях, як математика, програмування та кодування. У рамках вдосконалення додано функцію під назвою Claude Code, яка дозволяє ШІ шукати та редагувати код, запускати тести та навіть працювати з такими інструментами, як GitHub.

Для тих, хто зацікавлений у тестуванні можливостей моделі, Claude 3.7 Sonnet тепер доступний на різних платформах, у тому числі Додаток Клода, Anthropic API, Amazon Bedrock і Google Cloud, зберігаючи ту саму вартість доступу, що й у попередній версії.

Клод 3.7 Сонет
Пов'язана стаття:
Anthropic представляє Claude 3.7 Sonnet: Hybrid AI with Advanced Reasoning

Той факт, що Claude 3.7 Sonnet зумів подолати ключові етапи в Pokémon Red, підтверджує ідею, що Штучний інтелект розвивається семимильними кроками в плані міркувань і навчання. Цей тип тестування відкриває двері для Нові реальні програми, від автоматизації завдань до вирішення складних проблем без втручання людини.

Ексклюзивний вміст - натисніть тут  Як дізнатися мій IQ за допомогою тонометра?