- Hà una prestazione di 61,4% in OSWorld è hè in testa in SWE-bench Verificatu
- Gestisce compiti cumplessi per più di 30 ore è genera finu à 64.000 gettoni
- Aghjurnamenti à Claude Code è u novu SDK di l'agente Claude per l'agenti
- Sicurezza rinfurzata (ASL-3) è listessu prezzu: $ 3 / $ 15 per milione di gettoni
Anthropic hà publicatu Claude Sonnet 4.5, una evoluzione focalizzata nantu à a prugrammazione, l'agenti è u cuntrollu di l'urdinatore chì cerca di cunsulidà a piattaforma in ambienti prufessiunali. In un paisaghju cù rivali di altu livellu, a cumpagnia descrive sta versione cum'è a so mudellu più raffinatu è utile per i travaglii d'ingegneria a data.
A nova versione si basa nantu à a sperienza di a famiglia Sonnet, chì avia digià migliuratu u ragiunamentu è a codificazione in l'iterazioni precedenti. Basendu si nantu à sta basa, a versione 4.5 hà per scopu di allargà u scopu praticu cù avanzamenti in persistenza di l'attenzione, usu di strumenti è produttività, mantenendu una strategia prudente in materia di sicurezza è allineamentu.
Capacità chjave è miglioramenti di e prestazioni

Sicondu Antropicu, Claude Sonnet 4.5 hè capace di mantene a cuncentrazione per più di 30 ore nantu à compiti cumplessi. è multi-passu, chì favurisce i prughjetti longhi induve hè necessaria a continuità di u cuntestu. Supporta ancu risultati finu à 64.000 gettoni in una sola risposta, è offre cuntrolli per aghjustà u "tempu di riflessione" prima di risponde, equilibrendu a velocità è i dettagli secondu i bisogni.
In i veri travaglii davanti à l'urdinatore, A cumpagnia segnala un 61,4% in OSWorld, un saltu notevule da u 42,2% di u so predecessore in questu listessu test.In scenarii pratichi, u mudellu pò navigà in u web, cumpletà fogli di calculu è eseguisce azzioni in l'applicazioni desktop da l'estensione Chrome, riducendu u monitoraghju cuntinuu di l'utilizatori.
A terra di A prugrammazione cuncentra a maiò parte di i miglioramentiIn a valutazione verificata di SWE-bench, chì s'hè cuncentrata nantu à a codificazione applicata à prughjetti di u mondu reale, Sonnet 4.5 hè in testa cù 77,2% (cù cunfigurazioni chì aumentanu u numeru sottu à u calculu parallelu). Anthropic prupone chì u mudellu copra tuttu u ciclu di sviluppu: pianificazione, implementazione, refactoring è mantenimentu di grandi basi di codice.
Oltre u sviluppu puru, Antropicu identifica l'usi chì richiedenu flussi prulungati è coordinazione di passi.Da a cibersigurtà è a finanza à a produttività di l'uffiziu è a ricerca cù dati interni è esterni. In questi cuntesti, a prumessa stà in agenti più stabili capaci di sustene u travagliu à longu andà senza perde a cuerenza.
Strumenti è Ecosistema di Sviluppu

U lanciu vene accumpagnatu da Ciò chì hè novu à Claude Code: punti di cuntrollu per salvà u prugressu è vultà à i stati precedenti, cum'è storia di versione, unu interfaccia di terminale rinnuvata, estensione nativa per Visual Studio Code è migliuramenti à a mudificazione di u cuntestu è di a memoria via l'API per eseguisce attività più lunghe.
Anthropic presenta ancu in anteprima SDK di l'Agente Claude, chì replica l'infrastruttura chì a cumpagnia usa per custruisce i so propri agentiU kit offre strumenti per a memoria à longu andà, i sistemi di permessu è a coordinazione di i subagenti, facilitendu a creazione di suluzioni automatizate chì cooperanu versu obiettivi cumuni è assicuranu a cunnessione cù strumenti cum'è WireGuard.
Cum'è cumplementu, L'impresa permette temporaneamente "Imagine with Claude", una dimostrazione chì ci permette d'osservà cumu u mudellu genera software in tempu reale Nisun codice predefinitu. Questa anteprima, dispunibule per un tempu limitatu à l'utilizatori Max, illustra u putenziale di u mudellu per a creazione interattiva.
Sicurezza, allineamentu è resilienza
Anthropic include Sonnet 4.5 in u so livellu di prutezzione Livellu di Sicurezza IA 3 (ASL-3), cù filtri furmati per rilevà cuntenutu periculosu, in particulare quelli ligati à i risichi CBRN. A cumpagnia dichjara d'avè riduttu falsi pusitivi per un fattore di dece paragunatu à a versione iniziale di sti classificatori, è offre Continuità di a cunversazione cù Sonnet 4 s'ellu si verifica un bloccu di sicurezza.
In parallelu, a cumpagnia assicura chì U mudellu riduce i cumpurtamenti indesiderati cum'è l'adulazione o e risposte ingannevoli è rinfurza e difese contr'à i tentativi di iniezione prontaQueste misure indicanu un usu più affidabile in ambienti corporativi, induve l'esecuzione di azzioni automatizate richiede cuntrolli è tracciabilità.
Disponibilità, piattaforme è prezzi

Claude Sonnet 4.5 hè dispunibule nant'à Claude.ai (web, iOS è Android) è per i sviluppatori via a piattaforma di sviluppatori Claude, cù integrazione in servizii cum'è Amazon Bedrock è Google Cloud Vertex AI. U pianu gratuitu funziona cù un limite di sessione chì si resetta ogni cinque ore è un numeru variabile di missaghji à dumanda. I prezzi restanu listessi.$3 per milione di gettoni d'input è $15 per milione di gettoni di output.
Trà e nuove funzionalità d'accessu, L'estensione Chrome di Claude hè dispunibule per l'utilizatori Max. prima registratu nantu à a lista d'attesa. Ancu s'è i benchmarks suggerenu miglioramenti sustanziali paragunati à l'iterazioni precedenti, Anthropic nota chì a prestazione attuale dipende da u casu d'usu è da u budget di ragiunamentu cunfiguratu per ogni compitu.
Cù una cumbinazione di progressi in a codificazione, una più grande autonomia per l'agenti è una attenzione più stretta à a sicurezza, Claude Sonnet 4.5 hè pusizionatu cum'è una opzione solida per e squadre tecniche chì anu bisognu di continuità è cuntrollu in prucessi longhi, mantenendu costi stabili è cumpatibilità cù l'ecosistema digià implementatu da Anthropic.
Sò un entusiasta di a tecnulugia chì hà trasfurmatu i so interessi "geek" in una professione. Aghju passatu più di 10 anni di a mo vita cù a tecnulugia d'avanguardia è scacciendu ogni tipu di prugrammi per pura curiosità. Avà sò specializatu in tecnulugia di computer è video games. Questu hè chì dapoi più di 5 anni aghju scrittu per diversi siti web nantu à a tecnulugia è i video games, creendu articuli chì cercanu di dà l'infurmazioni chì avete bisognu in una lingua chì hè comprensibile à tutti.
Sì avete qualchì quistione, a mo cunniscenza varieghja da tuttu ciò chì riguarda u sistema operatore Windows è ancu Android per i telefunini. È u mo impegnu hè di voi, sò sempre dispostu à passà uni pochi di minuti è aiutavvi à risolve tutte e dumande chì pudete avè in questu mondu Internet.