- Rendeix un 61,4% a OSWorld i lidera a SWE-bench Verified
- Atén tasques complexes més de 30 hores i genera fins a 64.000 tokens
- Actualitzacions a Claude Code i nou Claude Agent SDK per a agents
- Seguretat reforçada (ASL-3) i mateix preu: $3/$15 per milió de tokens

Anthropic ha posat en circulació Claude Sonnet 4.5, una evolució enfocada a programació, agents i control de l'ordinador que cerca consolidar la plataforma en entorns professionals. En un panorama amb rivals d'alt nivell, la companyia descriu aquest llançament com a model més afinat i útil per a tasques denginyeria fins a la data.
La nova versió es recolza en la trajectòria de la família Sonnet, que ja havia millorat raonament i codificació en anteriors iteracions. A partir d'aquesta base, 4.5 apunta a ampliar l'abast pràctic amb avenços en persistència d'atenció, ús d'eines i productivitat, mantenint una estratègia prudent en seguretat i alineament.
Capacitats clau i millores de rendiment

Segons Anthropic, Claude Sonnet 4.5 és capaç de mantenir el focus durant més de 30 hores en tasques complexes i de múltiples passos, cosa que afavoreix projectes llargs en què es requereix continuïtat de context. També admet sortides de fins 64.000 tokens en una sola resposta, i ofereix controls per ajustar el “temps de reflexió” previ a respondre, equilibrant rapidesa i detall segons la necessitat.
En tasques reals davant de l'ordinador, la companyia reporta un 61,4% a OSWorld, un salt notable respecte al 42,2% del seu predecessor en aquesta mateixa prova. En escenaris pràctics, el model pot navegar per la web, completar fulls de càlcul i executar accions en aplicacions descriptori des de lextensió de Chrome, reduint la supervisió contínua de lusuari.
El terreny de la programació concentra la major part de les millores. A l'avaluació SWE-bench Verified, centrada en codificació aplicada a projectes reals, Sonnet 4.5 se situa al capdavant amb un 77,2% (amb configuracions que augmenten la xifra sota còmput en paral·lel). La proposta d'Anthropic és que el model cobreixi tot el cicle de desenvolupament: planificació, implementació, refactorització i manteniment de bases de codi extenses.
Més enllà del desenvolupament pur, Anthropic assenyala usos que requereixen fluxos perllongats i coordinació de passos: des de ciberseguretat i finances fins a productivitat ofimàtica i investigació amb dades internes i externes. En aquests contextos, la promesa passa per agents més estables, capaços de sostenir feines prolongades sense perdre coherència.
Eines per a desenvolupadors i ecosistema

El llançament arriba acompanyat de novetats a Claude Code: punts de control per guardar progressos i tornar a estats anteriors, com el historial de versions, Una interfície de terminal renovada, extensió nativa per a Visual Studio Code i millores en edició de context i memòria a través de l'API per executar tasques més llargues.
Anthropic també estrena el Claude Agent SDK, que replica la infraestructura que utilitza la companyia per construir els seus propis agents. El kit ofereix eines per a memòria a llarg termini, sistemes de permisos i coordinació de subagents, facilitant la creació de solucions automatitzades que cooperin cap a objectius comuns i connectivitat segura amb eines com WireGuard.
Com a complement, la signatura habilita de forma temporal “Imagine with Claude”, una demostració que permet observar com el model genera programari en temps real sense codi predefinit. Aquesta vista prèvia, disponible per temps limitat per a usuaris Max, il·lustra el potencial del model en creació interactiva.
Seguretat, alineament i resiliència
Anthropic emmarca Sonnet 4.5 al seu nivell de protecció AI Safety Level 3 (ASL-3), amb filtres entrenats per detectar continguts perillosos, especialment els relacionats amb riscos CBRN. L'empresa afirma haver reduït falsos positius per un factor de deu respecte a la versió inicial d'aquests classificadors, i ofereix continuïtat de conversa amb Sonnet 4 si es produeix un bloqueig per seguretat.
En paral·lel, la companyia assegura que el model disminueix conductes no desitjades com l'adulació o respostes enganyoses i reforça defenses davant d'intents de prompt injection. Aquestes mesures apunten a un ús més fiable en entorns corporatius, on l'execució d'accions automatitzades requereix controls i traçabilitat.
Disponibilitat, plataformes i preus

Claude Sonnet 4.5 està disponible a Claude.ai (web, iOS i Android) i per a desenvolupadors via Claude Developer Platform, amb integració en serveis com Amazon Bedrock i Google Cloud Vertex AI. El pla gratuït funciona amb límit de sessions que es reinicia cada cinc hores i un nombre variable de missatges segons la demanda. Els preus es mantenen: 3 dòlars per milió de tokens d'entrada i 15 dòlars per milió de tokens de sortida.
Entre les novetats d'accés, l'extensió de Claude per a Chrome es va desplegant als usuaris Max prèviament inscrits a la llista d'espera. Tot i que els benchmarks suggereixen millores substancials davant d'iteracions anteriors, Anthropic recorda que el rendiment real depèn del cas d'ús i del pressupost de raonament configurat per a cada tasca.
Amb una combinació d'avenços en codificació, més autonomia per a agents i un enfocament més estricte en seguretat, Claude Sonnet 4.5 es posiciona com una opció sòlida per a equips tècnics que necessiten continuïtat i control en processos llargs, mantenint costos estables i compatibilitat amb l'ecosistema ja desplegat d'Antropic.
Sóc un apassionat de la tecnologia que ha convertit els seus interessos frikis en professió. Porto més de 10 anys de la meva vida utilitzant tecnologia d'avantguarda i traslladant tota mena de programes per pura curiositat. Ara he especialitzat en tecnologia d'ordinador i videojocs. Això és perquè des de fa més de 5 anys que treballo redactant per a diverses webs en matèria de tecnologia i videojocs, creant articles que busquen donar-te la informació que necessites amb un llenguatge comprensible per tothom.
Si tens qualsevol pregunta, els meus coneixements van des de tot allò relacionat amb el sistema operatiu Windows així com Android per a mòbils. I és que el meu compromís és amb tu, sempre estic disposat a dedicar-te uns minuts i ajudar-te a resoldre qualsevol dubte que tinguis a aquest món d'internet.