- Anthropic-in Claude 3.7 Sonneti Twitch-də Pokémon Red oynayaraq sınaqdan keçirilib.
- Süni intellekt modeli əsaslandırma və qərar qəbul etmədə əhəmiyyətli irəliləyiş nümayiş etdirdi.
- O, oyunda ilk üç Gym Liderini məğlub etməyi bacardı, əvvəlki versiyalar buna nail ola bilmədi.
- Anthropic süni intellekt üçün qiymətləndirmə metodu kimi video oyunların istifadəsini vurğulayır.
Anthropic süni intellekt dünyasını heyrətləndirdi yeni Claude 3.7 Sonnet modelinin mürəkkəb tapşırıqlarda nə qədər irəliləyə biləcəyini nümayiş etdirərək. Bu münasibətlə və qabiliyyətlərin innovativ testinin bir hissəsi olaraq, AI sistemi Pokémon Red-də oynamaq üçün qoyuldu Twitch, burada tamaşaçılar gedişatı canlı izləyə bildilər.
Təcrübə süni intellektin nə qədər bacara biləcəyini göstərməyə çalışır strateji qərarlar qəbul edin və insan müdaxiləsi olmadan dinamik mühitdə naviqasiya etməyi öyrənin. Bu, oyun daxilində erkən maneələri aşa bilməyən modelin əvvəlki versiyaları ilə müqayisədə bir mərhələdir.
Klod 3.7 Sonnet əsaslandırmada irəliləyişləri nümayiş etdirir

AI modelindəki təkmilləşdirmələri qiymətləndirmək üçün Anthropic onu müəyyən əsas vasitələrlə təmin etdi: Ekran piksel girişi, əsas yaddaş və düyməyə nəzarət. Bu elementlər sayəsində Klod oyunda baş verənləri şərh edə və daxili məntiqinə əsaslanaraq qərarlar qəbul edə bildi.
Əvvəlki modellərdə, məsələn, Claude 3.0 Sonnet, süni intellekt O, baş qəhrəmanın evindən çıxmağa belə macal tapmayıb.. Bununla belə, bu yeni iterasiyada sistem xeyli irəliləyərək oyunda ilk üç İdman Zalı Rəhbəri olan Brock, Misty və Lt. Surge-ni məğlub etməyi bacardı.
Pokémon dünyasında 35.000 hərəkətdən ibarət səyahət

Klodun Pokémon Red-də səyahəti asan deyildi. Anthropic tərəfindən verilən məlumatlara görə, AI icra edildi təxminən 35.000 səhm Ciudad Carmín mərhələsini aşmağı bacarana qədər. Bu prosesin dəqiq vaxtı deyildi, ancaq modelin qabiliyyəti göstərildi dəyişikliklərə uyğunlaşın və nümunələri öyrənin ifaları zamanı.
Süni intellektin qiymətləndirilməsi üçün video oyunlardan istifadə yeni deyil. Lakin bu təcrübə bu fikri gücləndirir Bu mühitlər əsas vasitələrə çevrilə bilər əsaslandırma və uyğunlaşma qabiliyyətinə malik AI modellərində irəliləyişləri ölçmək.
Oyundan kənar: Claude 3.7 Sonnet və onun real dünya tətbiqləri

Pokémon Red daxilində bacarıq nümayiş etdirməklə yanaşı, Anthropic onun AI modelinin bacarıqlı olduğunu vurğuladı. mürəkkəb problemləri həll etmək riyaziyyat, proqramlaşdırma və kodlaşdırma kimi sahələrdə. Təkmilləşdirmələrin bir hissəsi olaraq, AI-yə kodu axtarmağa və redaktə etməyə, testlər keçirməyə və hətta GitHub kimi alətlərlə işləməyə imkan verən Claude Code adlı xüsusiyyət əlavə edildi.
Modelin imkanlarını sınamaqda maraqlı olanlar üçün Claude 3.7 Sonnet indi də daxil olmaqla müxtəlif platformalarda mövcuddur. Claude's app, Anthropic API, Amazon Bedrock və Google Cloud, əvvəlki versiyası ilə eyni giriş dəyərini saxlamaq.
Claude 3.7 Sonnet-in Pokémon Red daxilində əsas mərhələləri aşmağı bacarması bu fikri gücləndirir. Süni intellekt düşünmə və öyrənmə baxımından sıçrayışlarla irəliləyir. Bu cür testlər qapını açır Yeni real dünya tətbiqləri, tapşırıqların avtomatlaşdırılmasından mürəkkəb problemlərin insan müdaxiləsi olmadan həllinə qədər.
Mən öz "geek" maraqlarını peşəyə çevirmiş texnologiya həvəskarıyam. Mən həyatımın 10 ilindən çoxunu qabaqcıl texnologiyadan istifadə edərək və hər cür proqramlarla maraqlanaraq sərf etmişəm. İndi mən kompüter texnologiyası və video oyunları üzrə ixtisaslaşmışam. Bunun səbəbi, 5 ildən artıqdır ki, texnologiya və video oyunlarla bağlı müxtəlif saytlar üçün yazılar yazıram, sizə lazım olan məlumatları hamı üçün başa düşülən dildə verməyə çalışan məqalələr hazırlayıram.
Hər hansı bir sualınız varsa, mənim biliklərim Windows əməliyyat sistemi, eləcə də mobil telefonlar üçün Android ilə əlaqəli hər şeyi əhatə edir. Və mənim öhdəliyim sizədir, mən həmişə bir neçə dəqiqə sərf etməyə və bu internet dünyasında yarana biləcək bütün suallarınızı həll etməyə kömək etməyə hazıram.