- Claude 3.7 Sonnet від Anthropic протестовано під час гри в Pokémon Red на Twitch.
- Модель AI продемонструвала значний прогрес у міркуванні та прийнятті рішень.
- Йому вдалося перемогти перших трьох Gym Leaders у грі, чого не вдалося досягти попереднім версіям.
- Anthropic підкреслює використання відеоігор як методу оцінки штучного інтелекту.
Компанія Anthropic здивувала світ штучного інтелекту демонструючи, як далеко може зайти його нова модель Claude 3.7 Sonnet у складних завданнях. З цієї нагоди та в рамках інноваційного тестування можливостей, Система AI була використана для гри в Pokémon Red Сіпатися, де глядачі могли стежити за ходом у прямому ефірі.
Експеримент прагне показати, як штучний інтелект може приймати стратегічні рішення і навчитися орієнтуватися в динамічному середовищі без втручання людини. Це знаменує собою віху в порівнянні з попередніми версіями моделі, яким не вдалося подолати перші бар’єри в грі.
Клод 3.7 Сонет демонструє прогрес у міркуванні

Щоб оцінити вдосконалення моделі штучного інтелекту, Anthropic надав їй певні ключові інструменти: Введення пікселів на дисплеї, основна пам'ять і керування кнопками. Завдяки цим елементам Клод зміг інтерпретувати те, що відбувається в грі, і приймати рішення, виходячи з її внутрішньої логіки.
У попередніх моделях, таких як Claude 3.0 Sonnet, штучний інтелект Він навіть не встиг вийти з дому головного героя.. Однак у цій новій ітерації система значно просунулася вперед, зумівши перемогти Брока, Місті та лейтенанта Серджа, перших трьох лідерів тренажерних залів у грі.
Подорож із 35.000 XNUMX дій у світі покемонів

Подорож Клода в Pokémon Red була непростою. Згідно з даними, наданими Anthropic, ШІ страчено близько 35.000 XNUMX акцій поки не вдалося подолати етап Сьюдад-Кармін. Точний час, який зайняв цей процес, не вказано, але здатність моделі адаптуватися до змін і вивчати шаблони під час їх виконання.
Використання відеоігор для оцінки штучного інтелекту не є новим. Однак цей експеримент підтверджує цю думку Ці середовища можуть стати основними інструментами для вимірювання прогресу в моделях ШІ, здатних міркувати та адаптуватися.
За межами гри: Claude 3.7 Sonnet і його реальні програми

На додаток до демонстрації навичок у Pokémon Red, Anthropic підкреслив, що його модель AI здатна вирішувати складні проблеми у таких галузях, як математика, програмування та кодування. У рамках вдосконалення додано функцію під назвою Claude Code, яка дозволяє ШІ шукати та редагувати код, запускати тести та навіть працювати з такими інструментами, як GitHub.
Для тих, хто зацікавлений у тестуванні можливостей моделі, Claude 3.7 Sonnet тепер доступний на різних платформах, у тому числі Додаток Клода, Anthropic API, Amazon Bedrock і Google Cloud, зберігаючи ту саму вартість доступу, що й у попередній версії.
Той факт, що Claude 3.7 Sonnet зумів подолати ключові етапи в Pokémon Red, підтверджує ідею, що Штучний інтелект розвивається семимильними кроками в плані міркувань і навчання. Цей тип тестування відкриває двері для Нові реальні програми, від автоматизації завдань до вирішення складних проблем без втручання людини.
Я ентузіаст технологій, який перетворив свої "гікові" інтереси на професію. Я провів понад 10 років свого життя, користуючись передовими технологіями та возячись із усіма видами програм із чистої цікавості. Зараз я спеціалізуюся на комп’ютерних технологіях та відеоіграх. Це тому, що більше 5 років я писав для різних веб-сайтів про технології та відеоігри, створюючи статті, які прагнуть надати вам необхідну інформацію мовою, зрозумілою для всіх.
Якщо у вас є запитання, я знаю все, що стосується операційної системи Windows, а також Android для мобільних телефонів. І я зобов’язаний перед вами, я завжди готовий витратити кілька хвилин і допомогти вам вирішити будь-які запитання, які можуть виникнути в цьому світі Інтернету.