Claude Sonnet 4.5: Salto nella codifica, negli agenti e nell'uso del computer

Ultimo aggiornamento: 02/10/2025

  • Ha un rendimento del 61,4% in OSWorld ed è leader in SWE-bench Verificato
  • Gestisce attività complesse per più di 30 ore e genera fino a 64.000 token
  • Aggiornamenti a Claude Code e al nuovo Claude Agent SDK per gli agenti
  • Sicurezza migliorata (ASL-3) e stesso prezzo: $ 3/$ 15 per milione di token

Immagine del modello Claude Sonnet 4.5

Anthropic ha rilasciato Claude Sonnet 4.5, un'evoluzione focalizzata su programmazione, agenti e controllo computerizzato che mira a consolidare la piattaforma in ambienti professionali. In un panorama con concorrenti di alto livello, l'azienda descrive questa versione come la sua modello più raffinato e utile per compiti di ingegneria Fino ad oggi

La nuova versione si basa sui risultati ottenuti dalla famiglia Sonnet, che aveva già migliorato il ragionamento e la codifica nelle iterazioni precedenti. Partendo da questa base, la versione 4.5 mira ad ampliare la portata pratica con progressi in persistenza dell'attenzione, utilizzo degli strumenti e produttività, mantenendo una strategia prudente in materia di sicurezza e allineamento.

Funzionalità chiave e miglioramenti delle prestazioni

Immagine generica del Sonetto 4.5 di Claude

Secondo Anthropic, Claude Sonnet 4.5 è in grado di mantenere la concentrazione per più di 30 ore su attività complesse. e multi-step, che favorisce progetti lunghi in cui è richiesta continuità di contesto. Supporta anche output fino a 64.000 token in una singola rispostae offre controlli per regolare il "tempo di riflessione" prima di rispondere, bilanciando velocità e dettagli a seconda delle necessità.

Contenuti esclusivi: clicca qui  La Cina pone il veto all'acquisto da parte di Nvidia di chip AI dalle sue aziende tecnologiche

Nei compiti reali davanti al computer, L'azienda ha registrato un punteggio del 61,4% in OSWorld, un notevole balzo rispetto al 42,2% del suo predecessore nello stesso test.In scenari pratici, il modello può navigare sul web, compilare fogli di calcolo ed eseguire azioni nelle applicazioni desktop dall'estensione Chrome, riducendo il monitoraggio continuo degli utenti.

La terra di La programmazione concentra la maggior parte dei miglioramentiNella valutazione verificata da SWE-bench, che si è concentrata sulla codifica applicata a progetti del mondo reale, Sonnet 4.5 è in testa con il 77,2% (con configurazioni che ne aumentano il numero in caso di elaborazione parallela). Anthropic propone che il modello copra l'intero ciclo di sviluppo: pianificazione, implementazione, refactoring e manutenzione di grandi basi di codice.

Oltre il puro sviluppo, Antropico identifica gli usi che richiedono flussi prolungati e coordinamento dei passaggi.Dalla sicurezza informatica alla finanza, dalla produttività d'ufficio alla ricerca basata su dati interni ed esterni, in questi contesti la promessa risiede in agenti più stabili, in grado di sostenere il lavoro a lungo termine senza perdere coerenza.

Strumenti per sviluppatori ed ecosistema

codice Claude

Il lancio è accompagnato da Novità su Claude Code: posti di blocco per salvare i progressi e tornare agli stati precedenti, come cronologia delle versioni, One interfaccia terminale rinnovata, estensione nativa per Visual Studio Code e miglioramenti alla modifica del contesto e della memoria tramite l'API per eseguire attività più lunghe.

Contenuti esclusivi: clicca qui  Musicisti britannici pubblicano un album silenzioso per protestare contro l'intelligenza artificiale

Anthropic presenta anche in anteprima il SDK dell'agente Claude, che replica l'infrastruttura che l'azienda utilizza per costruire i propri agentiIl kit offre strumenti per la memoria a lungo termine, sistemi di autorizzazione e coordinamento dei subagenti, facilitando la creazione di soluzioni automatizzate che cooperano verso obiettivi comuni e una connettività sicura con strumenti come Gabbia di protezione.

A complemento, L'azienda abilita temporaneamente "Immagina con Claude", una dimostrazione che ci permette di osservare come il modello genera software in tempo reale Nessun codice predefinito. Questa anteprima, disponibile per un periodo limitato per gli utenti Max, illustra il potenziale del modello per la creazione interattiva.

Sicurezza, allineamento e resilienza

Anthropic include Sonnet 4.5 nel suo livello di protezione Livello di sicurezza AI 3 (ASL-3), con filtri addestrati a rilevare contenuti pericolosi, in particolare quelli relativi ai rischi CBRN. L'azienda afferma di aver ridotto falsi positivi di un fattore dieci rispetto alla versione iniziale di questi classificatori, e offre Continuità della conversazione con Sonnet 4 se si verifica un blocco di sicurezza.

Parallelamente, l'azienda garantisce che Il modello riduce i comportamenti indesiderati come l'adulazione o le risposte ingannevoli e rafforza le difese contro i tentativi di iniezione tempestivaQueste misure indicano un utilizzo più affidabile negli ambienti aziendali, dove l'esecuzione di azioni automatizzate richiede controlli e tracciabilità.

Contenuti esclusivi: clicca qui  Come modificare le foto con Gemini Flash 2.0 senza alcuna conoscenza di editing

Disponibilità, piattaforme e prezzi

Immagine di Claude Sonnet 4.5

Claude Sonnet 4.5 è disponibile su Claude.ai (web, iOS e Android) e per gli sviluppatori tramite la piattaforma Claude Developer, con integrazione in servizi come Amazon Bedrock e Google Cloud Vertex AI. Il piano gratuito prevede un limite di sessioni che si azzera ogni cinque ore e un numero variabile di messaggi on demand. I prezzi rimangono invariati.: 3 dollari per milione di token di input e 15 dollari per milione di token di output.

Tra le nuove funzionalità di accesso, L'estensione Chrome di Claude è in fase di distribuzione per gli utenti Max. precedentemente registrati in lista d'attesa. Sebbene i benchmark suggeriscano miglioramenti sostanziali rispetto alle iterazioni precedenti, Anthropic sottolinea che le prestazioni effettive dipendono dal caso d'uso e dal budget di ragionamento configurato per ciascuna attività.

Grazie alla combinazione di progressi nella codifica, maggiore autonomia per gli agenti e una maggiore attenzione alla sicurezza, Claude Sonnet 4.5 si posiziona come una solida opzione per i team tecnici che necessitano di continuità e controllo nei processi lunghi, mantenendo costi stabili e compatibilità con l'ecosistema già implementato da Anthropic.

adeguamento ai linkedin
Articolo correlato:
LinkedIn modifica la sua intelligenza artificiale: modifiche alla privacy, regioni e come disattivarla