- Den presterer 61,4 % i OSWorld og leder i SWE-bench Verifisert
- Håndterer komplekse oppgaver i mer enn 30 timer og genererer opptil 64 000 tokens
- Oppdateringer til Claude Code og det nye Claude Agent SDK-et for agenter
- Forbedret sikkerhet (ASL-3) og samme pris: $3/$15 per million tokens

Anthropic har lansert Claude Sonnet 4.5, en videreutvikling fokusert på programmering, agenter og datakontroll som søker å konsolidere plattformen i profesjonelle miljøer. I et landskap med rivaler på høyt nivå beskriver selskapet denne utgivelsen som sin mer raffinert og nyttig modell for ingeniøroppgaver til dags dato
Den nye versjonen bygger på Sonnet-familiens merittliste, som allerede hadde forbedret resonnering og koding i tidligere iterasjoner. Byggende på dette grunnlaget, tar 4.5 sikte på å utvide det praktiske omfanget med fremskritt innen utholdenhet av oppmerksomhet, verktøybruk og produktivitet, og opprettholder en forsiktig strategi innen sikkerhet og samordning.
Viktige funksjoner og ytelsesforbedringer

Ifølge Antropisk, Claude Sonnet 4.5 er i stand til å opprettholde fokus i mer enn 30 timer på komplekse oppgaver. og flertrinns, som favoriserer lange prosjekter der kontinuitet i konteksten er nødvendig. Den støtter også resultater på opptil 64 000 tokens i ett enkelt svar, og tilbyr kontroller for å justere «tenketiden» før respons, og balanserer hastighet og detaljer etter behov.
I virkelige oppgaver foran datamaskinen, Selskapet rapporterer 61,4 % i OSWorld, et bemerkelsesverdig hopp fra forgjengerens 42,2 % i samme test.I praktiske scenarier kan modellen surfe på nettet, fylle ut regneark og utføre handlinger i skrivebordsapplikasjoner fra Chrome-utvidelsen, noe som reduserer kontinuerlig brukerovervåking.
Landet til Programmeringen konsentrerer de fleste forbedringeneI SWE-bench Verified-evalueringen, som fokuserte på koding anvendt i prosjekter i den virkelige verden, Sonnet 4.5 leder an med 77,2 % (med konfigurasjoner som øker antallet under parallell databehandling). Anthropic foreslår at modellen dekker hele utviklingssyklusen: planlegging, implementering, refaktorering og vedlikehold av store kodebaser.
Utover ren utvikling, Antropisk identifiserer bruksområder som krever langvarige flyter og koordinering av trinn.Fra cybersikkerhet og finans til kontorproduktivitet og forskning ved bruk av interne og eksterne data. I disse sammenhengene ligger løftet i mer stabile agenter som er i stand til å opprettholde langsiktig arbeid uten å miste konsistens.
Utviklerverktøy og økosystem

Lanseringen kommer ledsaget av Hva er nytt hos Claude Code: sjekkpunkter for å lagre fremdriften og gå tilbake til tidligere tilstander, for eksempel versjonshistorikk, One fornyet terminalgrensesnitt, innebygd utvidelse for Visual Studio Code og forbedringer av kontekst- og minneredigering via API-et for å kjøre lengre oppgaver.
Antropisk har også premiere på Claude Agent SDK, som replikerer infrastrukturen selskapet bruker til å bygge sine egne agenterSettet tilbyr verktøy for langtidshukommelse, tillatelsessystemer og koordinering av underagenter, noe som letter opprettelsen av automatiserte løsninger som samarbeider mot felles mål og sikrer tilkobling med verktøy som WireGuard.
Som et komplement, Firmaet aktiverer midlertidig «Imagine with Claude», en demonstrasjon som lar oss observere hvordan modellen genererer programvare i sanntid Ingen forhåndsdefinert kode. Denne forhåndsvisningen, som er tilgjengelig i en begrenset periode for Max-brukere, illustrerer modellens potensial for interaktiv oppretting.
Sikkerhet, samordning og robusthet
Anthropic inkluderer Sonnet 4.5 i sitt beskyttelsesnivå AI-sikkerhetsnivå 3 (ASL-3), med filtre trent til å oppdage farlig innhold, spesielt innhold relatert til CBRN-risikoer. Selskapet hevder å ha redusert falske positiver med en faktor på ti sammenlignet med den første versjonen av disse klassifikatorene, og tilbyr Kontinuitet i samtalen med Sonnet 4 hvis en sikkerhetssperre oppstår.
Parallelt sørger selskapet for at Modellen reduserer uønsket atferd som smiger eller villedende reaksjoner og styrker forsvaret mot forsøk på å rask injeksjonDisse tiltakene peker mot bruk mer pålitelig i bedriftsmiljøer, der utførelsen av automatiserte handlinger krever kontroller og sporbarhet.
Tilgjengelighet, plattformer og priser

Claude Sonnet 4.5 er tilgjengelig på Claude.ai (nett, iOS og Android) og for utviklere via Claude Developer Platform, med integrasjon i tjenester som Amazon Bedrock og Google Cloud Vertex AI. Gratisabonnementet har en øktgrense som tilbakestilles hver femte time og et variabelt antall meldinger på forespørsel. Prisene forblir de samme.3 dollar per million input-tokens og 15 dollar per million output-tokens.
Blant de nye tilgangsfunksjonene, Claudes Chrome-utvidelse rulles ut til Max-brukere. tidligere registrert på venteliste. Selv om referansepunktene tyder på betydelige forbedringer sammenlignet med tidligere iterasjoner, bemerker Anthropic at den faktiske ytelsen avhenger av brukstilfellet og resonnementsbudsjettet som er konfigurert for hver oppgave.
Med en kombinasjon av fremskritt innen koding, større autonomi for agenter og et strengere fokus på sikkerhet, Claude Sonnet 4.5 er posisjonert som et solid alternativ for tekniske team som trenger kontinuitet og kontroll i lange prosesser, opprettholde stabile kostnader og kompatibilitet med Anthropics allerede distribuerte økosystem.
Jeg er en teknologientusiast som har gjort sine "geek"-interesser til et yrke. Jeg har brukt mer enn 10 år av livet mitt på å bruke banebrytende teknologi og fikse med alle slags programmer av ren nysgjerrighet. Nå har jeg spesialisert meg på datateknologi og videospill. Dette er fordi jeg i mer enn 5 år har skrevet for forskjellige nettsteder om teknologi og videospill, og laget artikler som prøver å gi deg den informasjonen du trenger på et språk som er forståelig for alle.
Hvis du har spørsmål, spenner min kunnskap fra alt relatert til Windows-operativsystemet samt Android for mobiltelefoner. Og mitt engasjement er til deg, jeg er alltid villig til å bruke noen minutter og hjelpe deg med å løse eventuelle spørsmål du måtte ha i denne internettverdenen.