- Ha un rendimento del 61,4% in OSWorld ed è leader in SWE-bench Verificato
- Gestisce attività complesse per più di 30 ore e genera fino a 64.000 token
- Aggiornamenti a Claude Code e al nuovo Claude Agent SDK per gli agenti
- Sicurezza migliorata (ASL-3) e stesso prezzo: $ 3/$ 15 per milione di token

Anthropic ha rilasciato Claude Sonnet 4.5, un'evoluzione focalizzata su programmazione, agenti e controllo computerizzato che mira a consolidare la piattaforma in ambienti professionali. In un panorama con concorrenti di alto livello, l'azienda descrive questa versione come la sua modello più raffinato e utile per compiti di ingegneria Fino ad oggi
La nuova versione si basa sui risultati ottenuti dalla famiglia Sonnet, che aveva già migliorato il ragionamento e la codifica nelle iterazioni precedenti. Partendo da questa base, la versione 4.5 mira ad ampliare la portata pratica con progressi in persistenza dell'attenzione, utilizzo degli strumenti e produttività, mantenendo una strategia prudente in materia di sicurezza e allineamento.
Funzionalità chiave e miglioramenti delle prestazioni

Secondo Anthropic, Claude Sonnet 4.5 è in grado di mantenere la concentrazione per più di 30 ore su attività complesse. e multi-step, che favorisce progetti lunghi in cui è richiesta continuità di contesto. Supporta anche output fino a 64.000 token in una singola rispostae offre controlli per regolare il "tempo di riflessione" prima di rispondere, bilanciando velocità e dettagli a seconda delle necessità.
Nei compiti reali davanti al computer, L'azienda ha registrato un punteggio del 61,4% in OSWorld, un notevole balzo rispetto al 42,2% del suo predecessore nello stesso test.In scenari pratici, il modello può navigare sul web, compilare fogli di calcolo ed eseguire azioni nelle applicazioni desktop dall'estensione Chrome, riducendo il monitoraggio continuo degli utenti.
La terra di La programmazione concentra la maggior parte dei miglioramentiNella valutazione verificata da SWE-bench, che si è concentrata sulla codifica applicata a progetti del mondo reale, Sonnet 4.5 è in testa con il 77,2% (con configurazioni che ne aumentano il numero in caso di elaborazione parallela). Anthropic propone che il modello copra l'intero ciclo di sviluppo: pianificazione, implementazione, refactoring e manutenzione di grandi basi di codice.
Oltre il puro sviluppo, Antropico identifica gli usi che richiedono flussi prolungati e coordinamento dei passaggi.Dalla sicurezza informatica alla finanza, dalla produttività d'ufficio alla ricerca basata su dati interni ed esterni, in questi contesti la promessa risiede in agenti più stabili, in grado di sostenere il lavoro a lungo termine senza perdere coerenza.
Strumenti per sviluppatori ed ecosistema

Il lancio è accompagnato da Novità su Claude Code: posti di blocco per salvare i progressi e tornare agli stati precedenti, come cronologia delle versioni, One interfaccia terminale rinnovata, estensione nativa per Visual Studio Code e miglioramenti alla modifica del contesto e della memoria tramite l'API per eseguire attività più lunghe.
Anthropic presenta anche in anteprima il SDK dell'agente Claude, che replica l'infrastruttura che l'azienda utilizza per costruire i propri agentiIl kit offre strumenti per la memoria a lungo termine, sistemi di autorizzazione e coordinamento dei subagenti, facilitando la creazione di soluzioni automatizzate che cooperano verso obiettivi comuni e una connettività sicura con strumenti come Gabbia di protezione.
A complemento, L'azienda abilita temporaneamente "Immagina con Claude", una dimostrazione che ci permette di osservare come il modello genera software in tempo reale Nessun codice predefinito. Questa anteprima, disponibile per un periodo limitato per gli utenti Max, illustra il potenziale del modello per la creazione interattiva.
Sicurezza, allineamento e resilienza
Anthropic include Sonnet 4.5 nel suo livello di protezione Livello di sicurezza AI 3 (ASL-3), con filtri addestrati a rilevare contenuti pericolosi, in particolare quelli relativi ai rischi CBRN. L'azienda afferma di aver ridotto falsi positivi di un fattore dieci rispetto alla versione iniziale di questi classificatori, e offre Continuità della conversazione con Sonnet 4 se si verifica un blocco di sicurezza.
Parallelamente, l'azienda garantisce che Il modello riduce i comportamenti indesiderati come l'adulazione o le risposte ingannevoli e rafforza le difese contro i tentativi di iniezione tempestivaQueste misure indicano un utilizzo più affidabile negli ambienti aziendali, dove l'esecuzione di azioni automatizzate richiede controlli e tracciabilità.
Disponibilità, piattaforme e prezzi

Claude Sonnet 4.5 è disponibile su Claude.ai (web, iOS e Android) e per gli sviluppatori tramite la piattaforma Claude Developer, con integrazione in servizi come Amazon Bedrock e Google Cloud Vertex AI. Il piano gratuito prevede un limite di sessioni che si azzera ogni cinque ore e un numero variabile di messaggi on demand. I prezzi rimangono invariati.: 3 dollari per milione di token di input e 15 dollari per milione di token di output.
Tra le nuove funzionalità di accesso, L'estensione Chrome di Claude è in fase di distribuzione per gli utenti Max. precedentemente registrati in lista d'attesa. Sebbene i benchmark suggeriscano miglioramenti sostanziali rispetto alle iterazioni precedenti, Anthropic sottolinea che le prestazioni effettive dipendono dal caso d'uso e dal budget di ragionamento configurato per ciascuna attività.
Grazie alla combinazione di progressi nella codifica, maggiore autonomia per gli agenti e una maggiore attenzione alla sicurezza, Claude Sonnet 4.5 si posiziona come una solida opzione per i team tecnici che necessitano di continuità e controllo nei processi lunghi, mantenendo costi stabili e compatibilità con l'ecosistema già implementato da Anthropic.
Sono un appassionato di tecnologia che ha trasformato i suoi interessi "geek" in una professione. Ho trascorso più di 10 anni della mia vita utilizzando tecnologie all'avanguardia e armeggiando con tutti i tipi di programmi per pura curiosità. Ora mi sono specializzato in informatica e videogiochi. Questo perché da più di 5 anni scrivo per vari siti web di tecnologia e videogiochi, creando articoli che cercano di darti le informazioni di cui hai bisogno in un linguaggio comprensibile a tutti.
In caso di domande, le mie conoscenze spaziano da tutto ciò che riguarda il sistema operativo Windows e Android per telefoni cellulari. E il mio impegno è nei tuoi confronti, sono sempre disposto a dedicare qualche minuto e aiutarti a risolvere qualsiasi domanda tu possa avere in questo mondo di Internet.