- Den præsterer 61,4% i OSWorld og fører i SWE-bench Verificeret
- Håndterer komplekse opgaver i mere end 30 timer og genererer op til 64.000 tokens
- Opdateringer til Claude Code og det nye Claude Agent SDK til agenter
- Forbedret sikkerhed (ASL-3) og samme pris: $3/$15 pr. million tokens

Anthropic har udgivet Claude Sonnet 4.5, en udvikling med fokus på programmering, agenter og computerkontrol, der søger at konsolidere platformen i professionelle miljøer. I et landskab med rivaler på højt niveau beskriver virksomheden denne udgivelse som sin ... mere raffineret og nyttig model til ingeniøropgaver til dato
Den nye version bygger videre på Sonnet-familiens resultater, som allerede har forbedret ræsonnement og kodning i tidligere iterationer. Med udgangspunkt i dette fundament sigter 4.5 mod at udvide det praktiske omfang med fremskridt inden for vedholdenhed i opmærksomhed, værktøjsbrug og produktivitet, og opretholder en forsigtig strategi inden for sikkerhed og tilpasning.
Nøglefunktioner og forbedringer af ydeevnen

Ifølge Antropisk, Claude Sonnet 4.5 er i stand til at holde fokus i mere end 30 timer på komplekse opgaver. og flertrinsprojekter, hvilket favoriserer lange projekter, hvor kontekstkontinuitet er påkrævet. Det understøtter også output på op til 64.000 tokens i et enkelt svar, og tilbyder kontroller til at justere "tænketiden" før svar, og afbalancere hastighed og detaljer efter behov.
I virkelige opgaver foran computeren, Virksomheden rapporterer 61,4% i OSWorld, et markant spring fra forgængerens 42,2% i samme test.I praktiske scenarier kan modellen surfe på nettet, udfylde regneark og udføre handlinger i desktopapplikationer fra Chrome-udvidelsen, hvilket reducerer kontinuerlig brugerovervågning.
Landet med Programmeringen koncentrerer de fleste forbedringerI SWE-bench Verified-evalueringen, som fokuserede på kodning anvendt i virkelige projekter, Sonnet 4.5 fører an med 77,2% (med konfigurationer, der øger antallet under parallel beregning). Anthropic foreslår, at modellen dækker hele udviklingscyklussen: planlægning, implementering, refactoring og vedligeholdelse af store kodebaser.
Ud over ren udvikling, Antropisk identificerer anvendelser, der kræver langvarige flow og koordinering af trin.Fra cybersikkerhed og finans til kontorproduktivitet og forskning ved hjælp af interne og eksterne data. I disse sammenhænge ligger løftet i mere stabile agenter, der er i stand til at opretholde langsigtet arbejde uden at miste konsistens.
Udviklerværktøjer og økosystem

Lanceringen kommer ledsaget af Nyheder hos Claude Code: kontrolpunkter for at gemme fremskridt og vende tilbage til tidligere tilstande, f.eks. version historie, One opdateret terminalgrænseflade, native udvidelse til Visual Studio Code og forbedringer af kontekst- og hukommelsesredigering via API'en for at køre længere opgaver.
Antropisk har også premiere på Claude Agent SDK, som replikerer den infrastruktur, virksomheden bruger til at opbygge sine egne agenterKittet tilbyder værktøjer til langtidshukommelse, tilladelsessystemer og koordinering af underagenter, hvilket letter oprettelsen af automatiserede løsninger, der samarbejder mod fælles mål og sikrer forbindelse med værktøjer som f.eks. WireGuard.
Som et supplement, Firmaet aktiverer midlertidigt “Imagine with Claude”en demonstration, der giver os mulighed for at observere, hvordan modellen genererer software i realtid Ingen foruddefineret kode. Denne forhåndsvisning, der er tilgængelig i en begrænset periode for Max-brugere, illustrerer modellens potentiale for interaktiv oprettelse.
Sikkerhed, tilpasning og robusthed
Anthropic inkluderer Sonnet 4.5 i sit beskyttelsesniveau AI-sikkerhedsniveau 3 (ASL-3), med filtre, der er trænet til at detektere farligt indhold, især indhold relateret til CBRN-risici. Virksomheden hævder at have reduceret falske positiver med en faktor ti sammenlignet med den oprindelige version af disse klassifikatorer, og tilbyder Kontinuitet i samtalen med Sonnet 4, hvis der opstår en sikkerhedsspærring.
Samtidig sørger virksomheden for, at Modellen reducerer uønsket adfærd såsom smiger eller vildledende reaktioner og styrker forsvaret mod forsøg på at hurtig indsprøjtningDisse foranstaltninger peger på en brug mere pålidelig i virksomhedsmiljøer, hvor udførelsen af automatiserede handlinger kræver kontrol og sporbarhed.
Tilgængelighed, platforme og priser

Claude Sonnet 4.5 er tilgængelig på Claude.ai (web, iOS og Android) og for udviklere via Claude Developer Platform, med integration i tjenester som Amazon Bedrock og Google Cloud Vertex AI. Gratisabonnementet har en sessionsgrænse, der nulstilles hver femte time, og et variabelt antal beskeder efter behov. Priserne forbliver de samme.$3 pr. million input-tokens og $15 pr. million output-tokens.
Blandt de nye adgangsfunktioner, Claudes Chrome-udvidelse rulles ud til Max-brugere. tidligere registreret på venteliste. Selvom benchmarks tyder på betydelige forbedringer i forhold til tidligere iterationer, bemærker Anthropic, at den faktiske ydeevne afhænger af use casen og det ræsonnementsbudget, der er konfigureret for hver opgave.
Med en kombination af fremskridt inden for kodning, større autonomi for agenter og et strengere fokus på sikkerhed, Claude Sonnet 4.5 er positioneret som en solid mulighed for tekniske teams, der har brug for kontinuitet og kontrol i lange processer, opretholdelse af stabile omkostninger og kompatibilitet med Anthropics allerede implementerede økosystem.
Jeg er en teknologientusiast, der har vendt sine "nørde" interesser til et erhverv. Jeg har brugt mere end 10 år af mit liv på at bruge avanceret teknologi og pille ved alle slags programmer af ren nysgerrighed. Nu har jeg specialiseret mig i computerteknologi og videospil. Dette skyldes, at jeg i mere end 5 år har skrevet til forskellige hjemmesider om teknologi og videospil, og lavet artikler, der søger at give dig den information, du har brug for, på et sprog, der er forståeligt for alle.
Har du spørgsmål, så spænder min viden fra alt relateret til Windows styresystemet samt Android til mobiltelefoner. Og mit engagement er over for dig, jeg er altid villig til at bruge et par minutter og hjælpe dig med at løse eventuelle spørgsmål, du måtte have i denne internetverden.