- Claude 3.7 Sonnet ta' Anthropic ġie ttestjat biex jilgħab Pokémon Red fuq Twitch.
- Il-mudell AI wera progress sinifikanti fir-raġunament u t-teħid tad-deċiżjonijiet.
- Huwa rnexxielu jegħleb l-ewwel tliet Gym Leaders fil-logħba, xi ħaġa li verżjonijiet preċedenti naqsu milli jiksbu.
- Anthropic jenfasizza l-użu tal-logħob tal-kompjuter bħala metodu ta 'evalwazzjoni għall-intelliġenza artifiċjali.
Anthropic sorpriż lid-dinja tal-intelliġenza artifiċjali billi juri kemm jista' jmur il-mudell il-ġdid tiegħu ta' Claude 3.7 Sonnet f'ħidmiet kumplessi. F'din l-okkażjoni, u bħala parti minn test innovattiv tal-kapaċitajiet, Is-sistema AI ġiet imqiegħda biex tilgħab fil-Pokémon Aħmar Twitch, fejn it-telespettaturi setgħu jsegwu l-progress live.
L-esperiment ifittex li juri kif l-intelliġenza artifiċjali tista ' jieħdu deċiżjonijiet strateġiċi u titgħallem jinnaviga f'ambjent dinamiku mingħajr intervent uman. Dan jimmarka pass importanti meta mqabbel mal-verżjonijiet preċedenti tal-mudell, li naqsu milli jegħlbu l-ostakli bikrija fil-logħba.
Claude 3.7 Is-sonnet juri avvanzi fir-raġunament

Biex tevalwa t-titjib fil-mudell AI, Anthropic ipprovdietlu ċerti għodod ewlenin: Display pixel input, memorja bażika u kontroll tal-buttuna. Grazzi għal dawn l-elementi, Claude kien kapaċi jinterpreta dak li kien qed jiġri fil-logħba u jieħu deċiżjonijiet ibbażati fuq il-loġika interna tagħha.
F'mudelli preċedenti, bħall-Claude 3.0 Sonnet, intelliġenza artifiċjali Lanqas biss irnexxielu joħroġ mid-dar tal-karattru prinċipali.. Madankollu, f'din l-iterazzjoni l-ġdida, is-sistema avvanzat konsiderevolment, u rnexxielha tegħleb lil Brock, Misty, u Lt Surge, l-ewwel tliet Gym Leaders fil-logħba.
Vjaġġ ta' 35.000 azzjoni fid-dinja Pokémon

Il-vjaġġ ta’ Claude f’Pokémon Red ma kienx faċli. Skont id-dejta pprovduta minn Anthropic, l-AI esegwit madwar 35.000 sehem sakemm irnexxielu jegħleb l-istadju ta’ Ciudad Carmín. Il-ħin eżatt li ħa dan il-proċess ma kienx speċifikat, iżda l-kapaċità tal-mudell li jadattaw għall-bidliet u jitgħallmu mudelli matul il-prestazzjoni tagħhom.
L-użu tal-logħob tal-kompjuter biex tevalwa l-intelliġenza artifiċjali mhuwiex ġdid. Madankollu, dan l-esperiment isaħħaħ l-idea li Dawn l-ambjenti jistgħu jsiru għodda fundamentali biex ikejjel il-progress fil-mudelli tal-IA li kapaċi jirraġunaw u jadattaw.
Lil hinn mill-logħba: Claude 3.7 Sonnet u l-applikazzjonijiet fid-dinja reali tiegħu

Minbarra li juri ħiliet fi ħdan Pokémon Red, Anthropic enfasizzat li l-mudell AI tiegħu huwa kapaċi issolvi problemi kumplessi f'oqsma bħall-matematika, l-ipprogrammar u l-kodifikazzjoni. Bħala parti mit-titjib tagħha, ġiet miżjuda karatteristika msejħa Claude Code, li tippermetti lill-AI tfittex u teditja l-kodiċi, tmexxi testijiet, u anke taħdem b'għodod bħal GitHub.
Għal dawk interessati li jittestjaw il-kapaċitajiet tal-mudell, Claude 3.7 Sonnet issa huwa disponibbli fuq varjetà ta 'pjattaformi, inklużi L-app ta' Claude, Anthropic API, Amazon Bedrock u Google Cloud, li żżomm l-istess spiża ta' aċċess bħall-verżjoni preċedenti tagħha.
Il-fatt li Claude 3.7 Sonnet irnexxielu jegħleb stadji ewlenin fi ħdan Pokémon Red isaħħaħ l-idea li L-intelliġenza artifiċjali qed tavvanza b'mod leaps u limiti f'termini ta 'raġunament u tagħlim. Dan it-tip ta 'ttestjar jiftaħ il-bieb għal Applikazzjonijiet ġodda fid-dinja reali, mill-awtomatizzazzjoni tal-kompiti għas-soluzzjoni ta 'problemi kumplessi mingħajr intervent uman.
Jien dilettant tat-teknoloġija li bidlet l-interessi "geek" tiegħu fi professjoni. Għamilt aktar minn 10 snin minn ħajti nuża teknoloġija avvanzata u nagħmel tbagħbis ma’ kull tip ta’ programmi għal kurżità pura. Issa speċjajtejt fit-teknoloġija tal-kompjuter u l-logħob tal-kompjuter. Dan għaliex ilni aktar minn 5 snin naħdem nikteb għal diversi websajts dwar teknoloġija u video games, noħloq artikli li jfittxu li jagħtuk l-informazzjoni li għandek bżonn b’lingwa li tinftiehem minn kulħadd.
Jekk għandek xi mistoqsijiet, l-għarfien tiegħi jvarja minn dak kollu relatat mas-sistema operattiva Windows kif ukoll Android għat-telefowns ċellulari. U l-impenn tiegħi huwa għalik, jien dejjem lest li nqatta' ftit minuti u ngħinek issolvi kwalunkwe mistoqsija li jista' jkollok f'din id-dinja tal-internet.