L-AI Claude ta' Anthropic jilgħab Pokémon fuq Twitch u jissorprendi bil-kapaċità ta' raġunament tiegħu

L-aħħar aġġornament: 28/02/2025

  • Claude 3.7 Sonnet ta' Anthropic ġie ttestjat biex jilgħab Pokémon Red fuq Twitch.
  • Il-mudell AI wera progress sinifikanti fir-raġunament u t-teħid tad-deċiżjonijiet.
  • Huwa rnexxielu jegħleb l-ewwel tliet Gym Leaders fil-logħba, xi ħaġa li verżjonijiet preċedenti naqsu milli jiksbu.
  • Anthropic jenfasizza l-użu tal-logħob tal-kompjuter bħala metodu ta 'evalwazzjoni għall-intelliġenza artifiċjali.
L-iktar mument kritiku ta’ Claude Ai f’Pokémon

Anthropic sorpriż lid-dinja tal-intelliġenza artifiċjali billi juri kemm jista' jmur il-mudell il-ġdid tiegħu ta' Claude 3.7 Sonnet f'ħidmiet kumplessi. F'din l-okkażjoni, u bħala parti minn test innovattiv tal-kapaċitajiet, Is-sistema AI ġiet imqiegħda biex tilgħab fil-Pokémon Aħmar Twitch, fejn it-telespettaturi setgħu jsegwu l-progress live.

L-esperiment ifittex li juri kif l-intelliġenza artifiċjali tista ' jieħdu deċiżjonijiet strateġiċi u titgħallem jinnaviga f'ambjent dinamiku mingħajr intervent uman. Dan jimmarka pass importanti meta mqabbel mal-verżjonijiet preċedenti tal-mudell, li naqsu milli jegħlbu l-ostakli bikrija fil-logħba.

Kontenut esklussiv - Ikklikkja Hawnhekk  Gwida Kompluta għall-Użu ta' Google Veo 3: Metodi, Rekwiżiti, u Pariri 2025

Claude 3.7 Is-sonnet juri avvanzi fir-raġunament

Claude 3.7 Sonnet

Biex tevalwa t-titjib fil-mudell AI, Anthropic ipprovdietlu ċerti għodod ewlenin: Display pixel input, memorja bażika u kontroll tal-buttuna. Grazzi għal dawn l-elementi, Claude kien kapaċi jinterpreta dak li kien qed jiġri fil-logħba u jieħu deċiżjonijiet ibbażati fuq il-loġika interna tagħha.

F'mudelli preċedenti, bħall-Claude 3.0 Sonnet, intelliġenza artifiċjali Lanqas biss irnexxielu joħroġ mid-dar tal-karattru prinċipali.. Madankollu, f'din l-iterazzjoni l-ġdida, is-sistema avvanzat konsiderevolment, u rnexxielha tegħleb lil Brock, Misty, u Lt Surge, l-ewwel tliet Gym Leaders fil-logħba.

Vjaġġ ta' 35.000 azzjoni fid-dinja Pokémon

Claude AI jilgħab Pokémon

Il-vjaġġ ta’ Claude f’Pokémon Red ma kienx faċli. Skont id-dejta pprovduta minn Anthropic, l-AI esegwit madwar 35.000 sehem sakemm irnexxielu jegħleb l-istadju ta’ Ciudad Carmín. Il-ħin eżatt li ħa dan il-proċess ma kienx speċifikat, iżda l-kapaċità tal-mudell li jadattaw għall-bidliet u jitgħallmu mudelli matul il-prestazzjoni tagħhom.

Kontenut esklussiv - Ikklikkja Hawnhekk  Google Scholar Labs: Hekk jaħdem it-tiftix akkademiku l-ġdid imħaddem bl-AI

L-użu tal-logħob tal-kompjuter biex tevalwa l-intelliġenza artifiċjali mhuwiex ġdid. Madankollu, dan l-esperiment isaħħaħ l-idea li Dawn l-ambjenti jistgħu jsiru għodda fundamentali biex ikejjel il-progress fil-mudelli tal-IA li kapaċi jirraġunaw u jadattaw.

Lil hinn mill-logħba: Claude 3.7 Sonnet u l-applikazzjonijiet fid-dinja reali tiegħu

Anthropic jippreżenta Claude 3.7 Sonnet-2

Minbarra li juri ħiliet fi ħdan Pokémon Red, Anthropic enfasizzat li l-mudell AI tiegħu huwa kapaċi issolvi problemi kumplessi f'oqsma bħall-matematika, l-ipprogrammar u l-kodifikazzjoni. Bħala parti mit-titjib tagħha, ġiet miżjuda karatteristika msejħa Claude Code, li tippermetti lill-AI tfittex u teditja l-kodiċi, tmexxi testijiet, u anke taħdem b'għodod bħal GitHub.

Għal dawk interessati li jittestjaw il-kapaċitajiet tal-mudell, Claude 3.7 Sonnet issa huwa disponibbli fuq varjetà ta 'pjattaformi, inklużi L-app ta' Claude, Anthropic API, Amazon Bedrock u Google Cloud, li żżomm l-istess spiża ta' aċċess bħall-verżjoni preċedenti tagħha.

Claude 3.7 Sonnet
Artiklu relatat:
Antropiku Jintroduċi Claude 3.7 Sonnet: AI Ibrida b'Raġunament Avvanzat

Il-fatt li Claude 3.7 Sonnet irnexxielu jegħleb stadji ewlenin fi ħdan Pokémon Red isaħħaħ l-idea li L-intelliġenza artifiċjali qed tavvanza b'mod leaps u limiti f'termini ta 'raġunament u tagħlim. Dan it-tip ta 'ttestjar jiftaħ il-bieb għal Applikazzjonijiet ġodda fid-dinja reali, mill-awtomatizzazzjoni tal-kompiti għas-soluzzjoni ta 'problemi kumplessi mingħajr intervent uman.

Kontenut esklussiv - Ikklikkja Hawnhekk  Kif inkun naf l-IQ tiegħi bit-Tontometer?