Claude Sonnet 4.5: Sprang innen koding, agenter og databruk

Siste oppdatering: 02/10/2025

  • Den presterer 61,4 % i OSWorld og leder i SWE-bench Verifisert
  • Håndterer komplekse oppgaver i mer enn 30 timer og genererer opptil 64 000 tokens
  • Oppdateringer til Claude Code og det nye Claude Agent SDK-et for agenter
  • Forbedret sikkerhet (ASL-3) og samme pris: $3/$15 per million tokens

Bilde av Claude Sonnet 4.5-modellen

Anthropic har lansert Claude Sonnet 4.5, en videreutvikling fokusert på programmering, agenter og datakontroll som søker å konsolidere plattformen i profesjonelle miljøer. I et landskap med rivaler på høyt nivå beskriver selskapet denne utgivelsen som sin mer raffinert og nyttig modell for ingeniøroppgaver til dags dato

Den nye versjonen bygger på Sonnet-familiens merittliste, som allerede hadde forbedret resonnering og koding i tidligere iterasjoner. Byggende på dette grunnlaget, tar 4.5 sikte på å utvide det praktiske omfanget med fremskritt innen utholdenhet av oppmerksomhet, verktøybruk og produktivitet, og opprettholder en forsiktig strategi innen sikkerhet og samordning.

Viktige funksjoner og ytelsesforbedringer

Generisk bilde av Claude Sonnet 4.5

Ifølge Antropisk, Claude Sonnet 4.5 er i stand til å opprettholde fokus i mer enn 30 timer på komplekse oppgaver. og flertrinns, som favoriserer lange prosjekter der kontinuitet i konteksten er nødvendig. Den støtter også resultater på opptil 64 000 tokens i ett enkelt svar, og tilbyr kontroller for å justere «tenketiden» før respons, og balanserer hastighet og detaljer etter behov.

Eksklusivt innhold - Klikk her  Palantir AI: Bedrifts-AI-en som står seg i forhold til Microsofts

I virkelige oppgaver foran datamaskinen, Selskapet rapporterer 61,4 % i OSWorld, et bemerkelsesverdig hopp fra forgjengerens 42,2 % i samme test.I praktiske scenarier kan modellen surfe på nettet, fylle ut regneark og utføre handlinger i skrivebordsapplikasjoner fra Chrome-utvidelsen, noe som reduserer kontinuerlig brukerovervåking.

Landet til Programmeringen konsentrerer de fleste forbedringeneI SWE-bench Verified-evalueringen, som fokuserte på koding anvendt i prosjekter i den virkelige verden, Sonnet 4.5 leder an med 77,2 % (med konfigurasjoner som øker antallet under parallell databehandling). Anthropic foreslår at modellen dekker hele utviklingssyklusen: planlegging, implementering, refaktorering og vedlikehold av store kodebaser.

Utover ren utvikling, Antropisk identifiserer bruksområder som krever langvarige flyter og koordinering av trinn.Fra cybersikkerhet og finans til kontorproduktivitet og forskning ved bruk av interne og eksterne data. I disse sammenhengene ligger løftet i mer stabile agenter som er i stand til å opprettholde langsiktig arbeid uten å miste konsistens.

Utviklerverktøy og økosystem

Claude-koden

Lanseringen kommer ledsaget av Hva er nytt hos Claude Code: sjekkpunkter for å lagre fremdriften og gå tilbake til tidligere tilstander, for eksempel versjonshistorikk, One fornyet terminalgrensesnitt, innebygd utvidelse for Visual Studio Code og forbedringer av kontekst- og minneredigering via API-et for å kjøre lengre oppgaver.

Eksklusivt innhold - Klikk her  Hva er Apple Intelligence: Slik bruker du det på iPhone, iPad og Mac

Antropisk har også premiere på Claude Agent SDK, som replikerer infrastrukturen selskapet bruker til å bygge sine egne agenterSettet tilbyr verktøy for langtidshukommelse, tillatelsessystemer og koordinering av underagenter, noe som letter opprettelsen av automatiserte løsninger som samarbeider mot felles mål og sikrer tilkobling med verktøy som WireGuard.

Som et komplement, Firmaet aktiverer midlertidig «Imagine with Claude», en demonstrasjon som lar oss observere hvordan modellen genererer programvare i sanntid Ingen forhåndsdefinert kode. Denne forhåndsvisningen, som er tilgjengelig i en begrenset periode for Max-brukere, illustrerer modellens potensial for interaktiv oppretting.

Sikkerhet, samordning og robusthet

Anthropic inkluderer Sonnet 4.5 i sitt beskyttelsesnivå AI-sikkerhetsnivå 3 (ASL-3), med filtre trent til å oppdage farlig innhold, spesielt innhold relatert til CBRN-risikoer. Selskapet hevder å ha redusert falske positiver med en faktor på ti sammenlignet med den første versjonen av disse klassifikatorene, og tilbyr Kontinuitet i samtalen med Sonnet 4 hvis en sikkerhetssperre oppstår.

Parallelt sørger selskapet for at Modellen reduserer uønsket atferd som smiger eller villedende reaksjoner og styrker forsvaret mot forsøk på å rask injeksjonDisse tiltakene peker mot bruk mer pålitelig i bedriftsmiljøer, der utførelsen av automatiserte handlinger krever kontroller og sporbarhet.

Eksklusivt innhold - Klikk her  Slik bruker du Copilot i Word: Komplett veiledning

Tilgjengelighet, plattformer og priser

Bilde av Claude Sonnet 4.5

Claude Sonnet 4.5 er tilgjengelig på Claude.ai (nett, iOS og Android) og for utviklere via Claude Developer Platform, med integrasjon i tjenester som Amazon Bedrock og Google Cloud Vertex AI. Gratisabonnementet har en øktgrense som tilbakestilles hver femte time og et variabelt antall meldinger på forespørsel. Prisene forblir de samme.3 dollar per million input-tokens og 15 dollar per million output-tokens.

Blant de nye tilgangsfunksjonene, Claudes Chrome-utvidelse rulles ut til Max-brukere. tidligere registrert på venteliste. Selv om referansepunktene tyder på betydelige forbedringer sammenlignet med tidligere iterasjoner, bemerker Anthropic at den faktiske ytelsen avhenger av brukstilfellet og resonnementsbudsjettet som er konfigurert for hver oppgave.

Med en kombinasjon av fremskritt innen koding, større autonomi for agenter og et strengere fokus på sikkerhet, Claude Sonnet 4.5 er posisjonert som et solid alternativ for tekniske team som trenger kontinuitet og kontroll i lange prosesser, opprettholde stabile kostnader og kompatibilitet med Anthropics allerede distribuerte økosystem.

LinkedIn-justering AI
Relatert artikkel:
LinkedIn justerer sin AI: endringer i personvern, regioner og hvordan du deaktiverer den