- Claude 3.7 Sonnet ад Anthropic быў пратэставаны ў Pokémon Red на Twitch.
- Мадэль AI прадэманстравала значны прагрэс у развагах і прыняцці рашэнняў.
- Яму ўдалося перамагчы першых трох Gym Leaders у гульні, чаго не ўдалося дасягнуць у папярэдніх версіях.
- Anthropic падкрэслівае выкарыстанне відэагульняў у якасці метаду ацэнкі штучнага інтэлекту.
Кампанія Anthropic здзівіла свет штучнага інтэлекту дэманструючы, наколькі далёка можа зайсці яго новая мадэль Claude 3.7 Sonnet у складаных задачах. З гэтай нагоды і ў рамках інавацыйнага тэсту магчымасцей, Сістэма AI была пастаўлена для гульні ў Pokémon Red Тузацца, дзе гледачы маглі сачыць за ходам у прамым эфіры.
Эксперымент імкнецца паказаць, як можа штучны інтэлект прымаць стратэгічныя рашэнні і навучыцца арыентавацца ў дынамічным асяроддзі без умяшання чалавека. Гэта важная вяха ў параўнанні з папярэднімі версіямі мадэлі, якія не змаглі пераадолець першыя бар'еры ў гульні.
Клод 3.7 Санет дэманструе поспехі ў развагах

Для ацэнкі паляпшэнняў мадэлі штучнага інтэлекту Anthropic забяспечыў яе некаторымі ключавымі інструментамі: Увод пікселяў дысплея, асноўная памяць і кіраванне кнопкамі. Дзякуючы гэтым элементам Клод змог інтэрпрэтаваць тое, што адбываецца ў гульні, і прымаць рашэнні, зыходзячы з яе ўнутранай логікі.
У папярэдніх мадэлях, такіх як Claude 3.0 Sonnet, штучны інтэлект Яму нават не ўдалося выйсці з дому галоўнага героя.. Аднак у гэтай новай ітэрацыі сістэма значна прасунулася, здолеўшы перамагчы Брока, Місці і лейтэнанта Сарджа, першых трох лідэраў трэнажорнай залы ў гульні.
Падарожжа з 35.000 XNUMX дзеянняў у свеце Pokémon

Падарожжа Клода ў Pokémon Red было нялёгкім. Паводле дадзеных, прадстаўленых Anthropic, AI пакараны каля 35.000 XNUMX акцый пакуль не здолеў пераадолець этап Сьюдад-Кармін. Дакладны час, які заняў гэты працэс, не ўдакладняецца, але здольнасць мадэлі адаптавацца да змен і вывучаць шаблоны падчас іх выканання.
Выкарыстанне відэагульняў для ацэнкі штучнага інтэлекту не новае. Аднак гэты эксперымент пацвярджае ідэю, што Гэтыя асяроддзя могуць стаць фундаментальнымі інструментамі для вымярэння прагрэсу ў мадэлях штучнага інтэлекту, здольных разважаць і адаптавацца.
За межамі гульні: Claude 3.7 Sonnet і яго рэальныя прыкладанні

У дадатак да дэманстрацыі навыкаў Pokémon Red, Anthropic падкрэсліла, што яе мадэль AI здольная вырашаць складаныя задачы у такіх галінах, як матэматыка, праграмаванне і кадаванне. У рамках паляпшэнняў была дададзена функцыя пад назвай Claude Code, якая дазваляе штучнаму інтэлекту шукаць і рэдагаваць код, запускаць тэсты і нават працаваць з такімі інструментамі, як GitHub.
Для тых, хто зацікаўлены ў тэставанні магчымасцей мадэлі, Claude 3.7 Sonnet цяпер даступны на розных платформах, у тым ліку Прыкладанне Клода, Anthropic API, Amazon Bedrock і Google Cloud, захоўваючы той жа кошт доступу, што і папярэдняя версія.
Той факт, што Claude 3.7 Sonnet здолеў пераадолець ключавыя этапы ў Pokémon Red, падмацоўвае ідэю, што Штучны інтэлект імкліва развіваецца з пункту гледжання разважанняў і навучання. Гэты тып тэставання адкрывае дзверы для Новыя рэальныя прыкладанні, ад аўтаматызацыі задач да рашэння складаных праблем без умяшання чалавека.
Я энтузіяст тэхналогій, які ператварыў свае інтарэсы "гікаў" у прафесію. Я правёў больш за 10 гадоў свайго жыцця, выкарыстоўваючы перадавыя тэхналогіі і важдаючыся з рознымі праграмамі з чыстай цікаўнасці. Цяпер я спецыялізаваўся на камп'ютарных тэхналогіях і відэагульнях. Гэта таму, што больш за 5 гадоў я працаваў для розных вэб-сайтаў, прысвечаных тэхналогіям і відэагульням, ствараючы артыкулы, якія імкнуцца даць вам неабходную інфармацыю на мове, зразумелай кожнаму.
Калі ў вас ёсць якія-небудзь пытанні, я ведаю ўсё, што звязана з аперацыйнай сістэмай Windows і Android для мабільных тэлефонаў. І я перад вамі абавязаны: я заўсёды гатовы выдаткаваць некалькі хвілін і дапамагчы вам вырашыць любыя пытанні, якія могуць узнікнуць у гэтым свеце Інтэрнэту.