- Soneti Claude 3.7 i Anthropic është testuar duke luajtur Pokémon Red në Twitch.
- Modeli i AI-së ka demonstruar përparim të rëndësishëm në arsyetim dhe vendimmarrje.
- Ai arriti të mposhtë tre Gym Leaders në lojë, diçka që versionet e mëparshme nuk arritën ta arrinin.
- Anthropic thekson përdorimin e lojërave video si një metodë vlerësimi për inteligjencën artificiale.
Anthropic ka habitur botën e inteligjencës artificiale duke demonstruar se sa larg mund të shkojë modeli i tij i ri Claude 3.7 Sonnet në detyra komplekse. Me këtë rast, dhe si pjesë e një testi inovativ të aftësive, Sistemi i AI u vendos për të luajtur Pokémon Red në Twitch, ku shikuesit mundën të ndiqnin ecurinë drejtpërdrejt.
Eksperimenti kërkon të tregojë se si mundet inteligjenca artificiale marrin vendime strategjike dhe mësoni të lundroni në një mjedis dinamik pa ndërhyrjen njerëzore. Kjo shënon një moment historik në krahasim me versionet e mëparshme të modelit, të cilat nuk kishin arritur të kapërcenin barrierat e hershme brenda lojës.
Claude 3.7 Sonet demonstron përparime në arsyetim

Për të vlerësuar përmirësimet në modelin e AI, Anthropic i ofroi disa mjete kyçe: Shfaq hyrjen e pikselit, memorien bazë dhe kontrollin e butonit. Falë këtyre elementeve, Claude ishte në gjendje të interpretonte atë që po ndodhte në lojë dhe të merrte vendime bazuar në logjikën e saj të brendshme.
Në modelet e mëparshme, siç është Soneti Claude 3.0, inteligjenca artificiale Ai nuk ka arritur as të largohet nga shtëpia e personazhit kryesor.. Megjithatë, në këtë përsëritje të re, sistemi ka avancuar në mënyrë të konsiderueshme, duke arritur të mposht Brock, Misty dhe Lt. Surge, tre udhëheqësit e parë të Gym Leaders në lojë.
Një udhëtim prej 35.000 veprimesh brenda botës Pokemon

Udhëtimi i Claude në Pokémon Red nuk ishte i lehtë. Sipas të dhënave të siguruara nga Anthropic, UA është ekzekutuar rreth 35.000 aksione derisa arriti të kapërcejë skenën e Ciudad Carmín. Nuk u specifikua koha e saktë që zgjati ky proces, por aftësia e modelit për të përshtatuni me ndryshimet dhe mësoni modelet gjatë performancës së tyre.
Përdorimi i videolojërave për të vlerësuar inteligjencën artificiale nuk është diçka e re. Megjithatë, ky eksperiment përforcon idenë se Këto mjedise mund të bëhen mjete themelore për të matur progresin në modelet e AI të afta për të arsyetuar dhe përshtatur.
Përtej lojës: Claude 3.7 Sonnet dhe aplikacionet e tij në botën reale

Përveç demonstrimit të aftësive brenda Pokémon Red, Anthropic ka theksuar se modeli i tij i AI është i aftë të zgjidhni probleme komplekse në fusha të tilla si matematika, programimi dhe kodimi. Si pjesë e përmirësimeve të tij, është shtuar një veçori e quajtur Claude Code, e cila lejon AI të kërkojë dhe modifikojë kodin, të kryejë teste dhe madje të punojë me mjete si GitHub.
Për ata që janë të interesuar të testojnë aftësitë e modelit, Claude 3.7 Sonnet tani është i disponueshëm në një sërë platformash, duke përfshirë Aplikacioni i Claude, Anthropic API, Amazon Bedrock dhe Google Cloud, duke ruajtur të njëjtën kosto aksesi si versioni i tij i mëparshëm.
Fakti që Claude 3.7 Sonnet ka arritur të kapërcejë fazat kryesore brenda Pokémon Red, përforcon idenë se Inteligjenca artificiale po përparon me hapa të mëdhenj në aspektin e arsyetimit dhe të të mësuarit. Ky lloj testimi hap derën për të Aplikacione të reja të botës reale, nga automatizimi i detyrave deri te zgjidhja e problemeve komplekse pa ndërhyrjen njerëzore.
Unë jam një entuziast i teknologjisë që i kam kthyer në profesion interesat e tij "geek". Kam shpenzuar më shumë se 10 vjet të jetës sime duke përdorur teknologjinë më të fundit dhe duke punuar me të gjitha llojet e programeve nga kurioziteti i pastër. Tani jam specializuar në teknologjinë kompjuterike dhe videolojërat. Kjo sepse prej më shumë se 5 vitesh shkruaj për faqe të ndryshme interneti mbi teknologjinë dhe videolojërat, duke krijuar artikuj që kërkojnë t'ju japin informacionin që ju nevojitet në një gjuhë të kuptueshme nga të gjithë.
Nëse keni ndonjë pyetje, njohuritë e mia variojnë nga gjithçka që lidhet me sistemin operativ Windows si dhe Android për telefonat celularë. Dhe angazhimi im është për ju, unë jam gjithmonë i gatshëm të kaloj disa minuta dhe t'ju ndihmoj të zgjidhni çdo pyetje që mund të keni në këtë botë të internetit.