- „OSWorld“ reitinge ji atlieka 61,4 % rezultatų ir pirmauja SWE-bench Verified vertinimų lentelėje.
- Atlieka sudėtingas užduotis daugiau nei 30 valandų ir generuoja iki 64 000 žetonų
- „Claude Code“ ir naujojo „Claude Agent SDK“ agentams atnaujinimai
- Patobulintas saugumas (ASL-3) ir ta pati kaina: 3 USD / 15 USD už milijoną žetonų
„Anthropic“ išleido „Claude Sonnet 4.5“ – evoliucinę versiją, skirtą programavimui, agentams ir kompiuterių valdymui, kuria siekiama įtvirtinti platformą profesionalioje aplinkoje. Turėdama aukšto lygio konkurentų, bendrovė šią versiją apibūdina kaip... rafinuotesnis ir naudingesnis inžinerinėms užduotims skirtas modelis iki šiol.
Naujoji versija remiasi „Sonnet“ šeimos, kuri ankstesnėse versijose jau patobulino samprotavimus ir kodavimą, patirtimi. Remiantis šiuo pagrindu, 4.5 versija siekia išplėsti praktinę taikymo sritį, tobulinant dėmesio atkaklumas, įrankių naudojimas ir produktyvumas, palaikydami apdairią saugumo ir suderinamumo strategiją.
Pagrindinės galimybės ir našumo patobulinimai

Pasak antropologijos, „Claude Sonnet 4.5“ geba išlaikyti dėmesį daugiau nei 30 valandų atliekant sudėtingas užduotis. ir daugiapakopis, kuris pirmenybę teikia ilgiems projektams, kuriems reikalingas konteksto tęstinumas. Jis taip pat palaiko iki 64 000 žetonų viename atsakymeir siūlo valdiklius, skirtus „mąstymo laikui“ prieš atsakant reguliuoti, pagal poreikį subalansuojant greitį ir detales.
Atliekant realias užduotis prie kompiuterio, Bendrovė „OSWorld“ teste praneša apie 61,4 % rezultatą – tai pastebimas šuolis, palyginti su ankstesnės bendrovės 42,2 % tame pačiame teste.Praktiškai modelis gali naršyti internete, pildyti skaičiuokles ir atlikti veiksmus darbalaukio programose iš „Chrome“ plėtinio, taip sumažinant nuolatinį naudotojų stebėjimą.
Žemė Programavimas sutelkia didžiąją dalį patobulinimųSWE-bench Verified vertinime, kuriame daugiausia dėmesio skirta kodavimo taikymui realiuose projektuose, „Sonnet 4.5“ pirmauja su 77,2 %. (su konfigūracijomis, kurios padidina skaičių lygiagrečių skaičiavimų metu). „Anthropic“ siūlo, kad modelis apimtų visą kūrimo ciklą: didelių kodo bazių planavimas, įgyvendinimas, pertvarkymas ir priežiūra.
Už gryno vystymosi ribų, Antropinis identifikuoja naudojimo būdus, kuriems reikalingi ilgi srautai ir žingsnių koordinavimas.Nuo kibernetinio saugumo ir finansų iki biuro produktyvumo ir tyrimų, naudojant vidinius ir išorinius duomenis. Šiomis aplinkybėmis perspektyviausi yra stabilesni agentai, galintys palaikyti ilgalaikį darbą neprarandant nuoseklumo.
Kūrėjo įrankiai ir ekosistema

Paleidimas vyksta kartu su Kas naujo Claude'o Code'e?: kontroliniai punktai išsaugoti progresą ir grįžti į ankstesnes būsenas, pvz. versijų istorija, Vienas atnaujinta terminalo sąsaja, gimtoji „Visual Studio Code“ plėtinys ir konteksto bei atminties redagavimo patobulinimai naudojant API, kad būtų galima vykdyti ilgesnes užduotis.
„Anthropic“ taip pat pristato Claude'o agento SDK, kuri atkartoja infrastruktūrą, kurią įmonė naudoja kurdama savo agentusRinkinyje siūlomi ilgalaikės atminties, leidimų sistemų ir subagentų koordinavimo įrankiai, palengvinantys automatizuotų sprendimų, kurie bendradarbiauja siekdami bendrų tikslų ir užtikrina saugų ryšį su tokiais įrankiais kaip WireGuard.
Kaip papildymą, Įmonė laikinai įjungia „Įsivaizduok su Claude'u“, demonstracija, leidžianti stebėti, kaip modelis generuoja programinę įrangą realiuoju laiku Nėra iš anksto apibrėžto kodo. Ši peržiūra, prieinama ribotą laiką „Max“ vartotojams, iliustruoja modelio interaktyvaus kūrimo potencialą.
Saugumas, suderinamumas ir atsparumas
„Anthropic“ savo apsaugos lygyje įtraukė „Sonnet 4.5“ DI saugos lygis 3 (ASL-3), su filtrais, apmokytais aptikti pavojingą turinį, ypač susijusį su ChBRB rizika. Bendrovė teigia, kad sumažino klaidingai teigiamų rezultatų dešimt kartų palyginti su pradine šių klasifikatorių versija ir siūlo Pokalbio su „Sonnet 4“ tęstinumas, jei įvyksta saugumo blokavimas.
Tuo pačiu metu bendrovė užtikrina, kad Modelis sumažina nepageidaujamą elgesį, pavyzdžiui, meilikavimą ar apgaulingas reakcijas, ir sustiprina apsaugą nuo bandymų greita injekcijaŠiomis priemonėmis siekiama panaudoti patikimesnis įmonių aplinkoje, kai automatizuotų veiksmų vykdymui reikalinga kontrolė ir atsekamumas.
Prieinamumas, platformos ir kainos

„Claude Sonnet 4.5“ galima įsigyti svetainėje Claude.ai. (žiniatinklis, „iOS“ ir „Android“) ir kūrėjams per „Claude“ kūrėjų platformą, integruojant į tokias paslaugas kaip „Amazon Bedrock“ ir „Google Cloud Vertex AI“. Nemokamas planas veikia su sesijos limitu, kuris iš naujo nustatomas kas penkias valandas, ir kintamu pranešimų skaičiumi pagal poreikį. Kainos išlieka tos pačios.3 USD už milijoną įvesties žetonų ir 15 USD už milijoną išvesties žetonų.
Tarp naujų prieigos funkcijų, Claude'o „Chrome“ plėtinys pradedamas diegti „Max“ vartotojams. anksčiau užregistruotas laukiančiųjų sąraše. Nors lyginamieji testai rodo esminius patobulinimus, palyginti su ankstesnėmis iteracijomis, „Anthropic“ pažymi, kad faktinis našumas priklauso nuo naudojimo atvejo ir kiekvienai užduočiai sukonfigūruoto samprotavimo biudžeto.
Dėl programavimo pažangos, didesnės agentų autonomijos ir griežtesnio dėmesio saugumui, „Claude Sonnet 4.5“ yra pozicionuojamas kaip patikimas pasirinkimas. techninėms komandoms, kurioms reikalingas tęstinumas ir kontrolė ilguose procesuose, išlaikyti stabilias išlaidas ir suderinamumą su jau įdiegta „Anthropic“ ekosistema.
Esu technologijų entuziastas, savo „geek“ pomėgius pavertęs profesija. Daugiau nei 10 savo gyvenimo metų praleidau naudodamas pažangiausias technologijas ir iš gryno smalsumo kūriau visas programas. Dabar aš specializuojasi kompiuterinėse technologijose ir vaizdo žaidimuose. Taip yra todėl, kad daugiau nei 5 metus rašau įvairioms interneto svetainėms apie technologijas ir vaizdo žaidimus, kurdamas straipsnius, kuriuose noriu pateikti jums reikalingą informaciją visiems suprantama kalba.
Jei turite klausimų, mano žinios svyruoja nuo visko, kas susiję su Windows operacine sistema, taip pat su Android mobiliesiems telefonams. Ir aš įsipareigoju jums, aš visada pasiruošęs skirti kelias minutes ir padėti jums išspręsti visus klausimus, kurie jums gali kilti šiame interneto pasaulyje.