Клод з AI з Anthropic гуляе ў Pokémon на Twitch і здзіўляе сваёй здольнасцю разважаць

Апошняе абнаўленне: 28/02/2025

  • Claude 3.7 Sonnet ад Anthropic быў пратэставаны ў Pokémon Red на Twitch.
  • Мадэль AI прадэманстравала значны прагрэс у развагах і прыняцці рашэнняў.
  • Яму ўдалося перамагчы першых трох Gym Leaders у гульні, чаго не ўдалося дасягнуць у папярэдніх версіях.
  • Anthropic падкрэслівае выкарыстанне відэагульняў у якасці метаду ацэнкі штучнага інтэлекту.
Самы крытычны момант Клода Ая ў Pokémon

Кампанія Anthropic здзівіла свет штучнага інтэлекту дэманструючы, наколькі далёка можа зайсці яго новая мадэль Claude 3.7 Sonnet у складаных задачах. З гэтай нагоды і ў рамках інавацыйнага тэсту магчымасцей, Сістэма AI была пастаўлена для гульні ў Pokémon Red Тузацца, дзе гледачы маглі сачыць за ходам у прамым эфіры.

Эксперымент імкнецца паказаць, як можа штучны інтэлект прымаць стратэгічныя рашэнні і навучыцца арыентавацца ў дынамічным асяроддзі без умяшання чалавека. Гэта важная вяха ў параўнанні з папярэднімі версіямі мадэлі, якія не змаглі пераадолець першыя бар'еры ў гульні.

Эксклюзіўны кантэнт - націсніце тут  Джэйсан Момоа раскрывае новыя падрабязнасці аб сваёй ролі Лоба ў DCU.

Клод 3.7 Санет дэманструе поспехі ў развагах

Клод 3.7 Санет

Для ацэнкі паляпшэнняў мадэлі штучнага інтэлекту Anthropic забяспечыў яе некаторымі ключавымі інструментамі: Увод пікселяў дысплея, асноўная памяць і кіраванне кнопкамі. Дзякуючы гэтым элементам Клод змог інтэрпрэтаваць тое, што адбываецца ў гульні, і прымаць рашэнні, зыходзячы з яе ўнутранай логікі.

У папярэдніх мадэлях, такіх як Claude 3.0 Sonnet, штучны інтэлект Яму нават не ўдалося выйсці з дому галоўнага героя.. Аднак у гэтай новай ітэрацыі сістэма значна прасунулася, здолеўшы перамагчы Брока, Місці і лейтэнанта Сарджа, першых трох лідэраў трэнажорнай залы ў гульні.

Падарожжа з 35.000 XNUMX дзеянняў у свеце Pokémon

Клод AI гуляе ў покемонаў

Падарожжа Клода ў Pokémon Red было нялёгкім. Паводле дадзеных, прадстаўленых Anthropic, AI пакараны каля 35.000 XNUMX акцый пакуль не здолеў пераадолець этап Сьюдад-Кармін. Дакладны час, які заняў гэты працэс, не ўдакладняецца, але здольнасць мадэлі адаптавацца да змен і вывучаць шаблоны падчас іх выканання.

Эксклюзіўны кантэнт - націсніце тут  Windows 11 Agentic AI: будучыня аўтаномнага штучнага інтэлекту прыбыла на ваш ПК.

Выкарыстанне відэагульняў для ацэнкі штучнага інтэлекту не новае. Аднак гэты эксперымент пацвярджае ідэю, што Гэтыя асяроддзя могуць стаць фундаментальнымі інструментамі для вымярэння прагрэсу ў мадэлях штучнага інтэлекту, здольных разважаць і адаптавацца.

За межамі гульні: Claude 3.7 Sonnet і яго рэальныя прыкладанні

Anthropic прадстаўляе Клод 3.7 Санет-2

У дадатак да дэманстрацыі навыкаў Pokémon Red, Anthropic падкрэсліла, што яе мадэль AI здольная вырашаць складаныя задачы у такіх галінах, як матэматыка, праграмаванне і кадаванне. У рамках паляпшэнняў была дададзена функцыя пад назвай Claude Code, якая дазваляе штучнаму інтэлекту шукаць і рэдагаваць код, запускаць тэсты і нават працаваць з такімі інструментамі, як GitHub.

Для тых, хто зацікаўлены ў тэставанні магчымасцей мадэлі, Claude 3.7 Sonnet цяпер даступны на розных платформах, у тым ліку Прыкладанне Клода, Anthropic API, Amazon Bedrock і Google Cloud, захоўваючы той жа кошт доступу, што і папярэдняя версія.

Клод 3.7 Санет
звязаныя артыкулы:
Anthropic прадстаўляе Claude 3.7 Sonnet: Hybrid AI with Advanced Reasoning

Той факт, што Claude 3.7 Sonnet здолеў пераадолець ключавыя этапы ў Pokémon Red, падмацоўвае ідэю, што Штучны інтэлект імкліва развіваецца з пункту гледжання разважанняў і навучання. Гэты тып тэставання адкрывае дзверы для Новыя рэальныя прыкладанні, ад аўтаматызацыі задач да рашэння складаных праблем без умяшання чалавека.

Эксклюзіўны кантэнт - націсніце тут  Дэма-версія гульні MARVEL Cosmic Invasion цяпер даступная ў Steam.