Claude Sonnet 4.5: Ett steg framåt inom kodning, agenter och datoranvändning

Senaste uppdateringen: 02/10/2025
Författare: Alberto navarro

  • Den presterar 61,4 % i OSWorld och är ledande i SWE-testet. Verifierad
  • Hanterar komplexa uppgifter i mer än 30 timmar och genererar upp till 64 000 tokens
  • Uppdateringar av Claude Code och det nya Claude Agent SDK för agenter
  • Förbättrad säkerhet (ASL-3) och samma pris: 3 USD/15 USD per miljon tokens

Bild av Claude Sonnet 4.5-modellen

Anthropic har släppt Claude Sonnet 4.5, en utvecklingsplattform med fokus på programmering, agenter och datorstyrning som syftar till att konsolidera plattformen i professionella miljöer. I ett landskap med rivaler på hög nivå beskriver företaget denna utgåva som sin ... mer förfinad och användbar modell för tekniska uppgifter hittills

Den nya versionen bygger vidare på Sonnet-familjens meritlista, som redan förbättrat resonemang och kodning i tidigare iterationer. Med utgångspunkt i den grunden syftar 4.5 till att utöka det praktiska omfånget med framsteg inom uthållighet i uppmärksamhet, verktygsanvändning och produktivitet, och upprätthåller en försiktig strategi inom säkerhet och anpassning.

Viktiga funktioner och prestandaförbättringar

Generisk bild av Claude Sonnet 4.5

Enligt Antropisk, Claude Sonnet 4.5 kan bibehålla fokus i mer än 30 timmar på komplexa uppgifter. och flerstegsprojekt, vilket gynnar långa projekt där kontinuitet i kontexten krävs. Den stöder även resultat på upp till 64 000 tokens i ett enda svar, och erbjuder kontroller för att justera "betänketiden" innan svar, och balansera hastighet och detaljer efter behov.

Exklusivt innehåll - Klicka här  YouTube skärper sin policy mot massproducerade och AI-drivna videor

I verkliga uppgifter framför datorn, Företaget rapporterar 61,4 % i OSWorld, ett anmärkningsvärt hopp från föregångarens 42,2 % i samma test.I praktiska scenarier kan modellen surfa på webben, fylla i kalkylblad och utföra åtgärder i skrivbordsapplikationer från Chrome-tillägget, vilket minskar kontinuerlig användarövervakning.

Landet av Programmeringen koncentrerar de flesta förbättringarnaI SWE-bench Verified-utvärderingen, som fokuserade på kodning tillämpad på verkliga projekt, Sonnet 4.5 leder vägen med 77,2 % (med konfigurationer som ökar antalet vid parallell beräkning). Anthropic föreslår att modellen täcker hela utvecklingscykeln: planering, implementering, refactoring och underhåll av stora kodbaser.

Utöver ren utveckling, Antropisk identifierar användningsområden som kräver långvariga flöden och samordning av steg.Från cybersäkerhet och finans till kontorsproduktivitet och forskning med hjälp av interna och externa data. I dessa sammanhang ligger löfte i mer stabila agenter som kan upprätthålla långsiktigt arbete utan att förlora konsekvens.

Utvecklarverktyg och ekosystem

Claude-kod

Lanseringen kommer tillsammans med Nyheter på Claude Code: kontrollpunkter för att spara framsteg och återgå till tidigare tillstånd, till exempel versionshistorik, En omarbetat terminalgränssnitt, inbyggd tillägg för Visual Studio Code och förbättringar av kontext- och minnesredigering via API:et för att köra längre uppgifter.

Exklusivt innehåll - Klicka här  Antropisk och fallet med AI:n som rekommenderade att man dricker blekmedel: när modeller fuskar

Antropisk har också premiär för Claude Agent SDK, vilket replikerar den infrastruktur som företaget använder för att bygga sina egna agenterKitet erbjuder verktyg för långtidsminne, behörighetssystem och samordning av underagenter, vilket underlättar skapandet av automatiserade lösningar som samarbetar mot gemensamma mål och säker anslutning med verktyg som WireGuard.

Som ett komplement, Företaget möjliggör tillfälligt "Imagine with Claude", en demonstration som låter oss observera hur modellen genererar programvara i realtid Ingen fördefinierad kod. Denna förhandsvisning, tillgänglig under en begränsad tid för Max-användare, illustrerar modellens potential för interaktivt skapande.

Säkerhet, samordning och motståndskraft

Anthropic inkluderar Sonnet 4.5 i sin skyddsnivå AI-säkerhetsnivå 3 (ASL-3), med filter som är tränade att upptäcka farligt innehåll, särskilt sådant som är relaterat till CBRN-risker. Företaget hävdar att de har minskat falska positiva resultat med en faktor tio jämfört med den ursprungliga versionen av dessa klassificerare, och erbjuder Kontinuitet i samtalet med Sonnet 4 om en säkerhetslåsning inträffar.

Parallellt säkerställer företaget att Modellen minskar oönskade beteenden som smicker eller vilseledande reaktioner och stärker försvaret mot försök att snabb injektionDessa åtgärder pekar på en användning mer pålitlig i företagsmiljöer, där utförandet av automatiserade åtgärder kräver kontroller och spårbarhet.

Exklusivt innehåll - Klicka här  Gemini AI kan nu hitta låtar som Shazam från din mobiltelefon

Tillgänglighet, plattformar och priser

Bild av Claude Sonnet 4.5

Claude Sonnet 4.5 finns tillgänglig på Claude.ai (webb, iOS och Android) och för utvecklare via Claude Developer Platform, med integration med tjänster som Amazon Bedrock och Google Cloud Vertex AI. Gratisplanen har en sessionsgräns som återställs var femte timme och ett variabelt antal meddelanden på begäran. Priserna förblir desamma.3 dollar per miljon inmatningstokens och 15 dollar per miljon utmatningstokens.

Bland de nya åtkomstfunktionerna, Claudes Chrome-tillägg lanseras för Max-användare. tidigare registrerad på väntelistan. Även om riktmärkena tyder på betydande förbättringar jämfört med tidigare iterationer, noterar Anthropic att den faktiska prestandan beror på användningsfallet och den budget som konfigurerats för varje uppgift.

Med en kombination av framsteg inom kodning, större autonomi för agenter och ett striktare fokus på säkerhet, Claude Sonnet 4.5 är positionerad som ett solidt alternativ för tekniska team som behöver kontinuitet och kontroll i långa processer, upprätthålla stabila kostnader och kompatibilitet med Anthropics redan driftsatta ekosystem.

LinkedIn-justering AI
Relaterad artikel:
LinkedIn justerar sin AI: sekretessändringar, regioner och hur man inaktiverar den