Claude Sonnet 4.5: Spring inden for kodning, agenter og computerbrug

Sidste ændring: 02/10/2025

  • Den præsterer 61,4% i OSWorld og fører i SWE-bench Verificeret
  • Håndterer komplekse opgaver i mere end 30 timer og genererer op til 64.000 tokens
  • Opdateringer til Claude Code og det nye Claude Agent SDK til agenter
  • Forbedret sikkerhed (ASL-3) og samme pris: $3/$15 pr. million tokens

Billede af Claude Sonnet 4.5-modellen

Anthropic har udgivet Claude Sonnet 4.5, en udvikling med fokus på programmering, agenter og computerkontrol, der søger at konsolidere platformen i professionelle miljøer. I et landskab med rivaler på højt niveau beskriver virksomheden denne udgivelse som sin ... mere raffineret og nyttig model til ingeniøropgaver til dato

Den nye version bygger videre på Sonnet-familiens resultater, som allerede har forbedret ræsonnement og kodning i tidligere iterationer. Med udgangspunkt i dette fundament sigter 4.5 mod at udvide det praktiske omfang med fremskridt inden for vedholdenhed i opmærksomhed, værktøjsbrug og produktivitet, og opretholder en forsigtig strategi inden for sikkerhed og tilpasning.

Nøglefunktioner og forbedringer af ydeevnen

Generisk billede af Claude Sonnet 4.5

Ifølge Antropisk, Claude Sonnet 4.5 er i stand til at holde fokus i mere end 30 timer på komplekse opgaver. og flertrinsprojekter, hvilket favoriserer lange projekter, hvor kontekstkontinuitet er påkrævet. Det understøtter også output på op til 64.000 tokens i et enkelt svar, og tilbyder kontroller til at justere "tænketiden" før svar, og afbalancere hastighed og detaljer efter behov.

Eksklusivt indhold - Klik her  Sådan bruges Copilot Vision på Edge: Funktioner og tips

I virkelige opgaver foran computeren, Virksomheden rapporterer 61,4% i OSWorld, et markant spring fra forgængerens 42,2% i samme test.I praktiske scenarier kan modellen surfe på nettet, udfylde regneark og udføre handlinger i desktopapplikationer fra Chrome-udvidelsen, hvilket reducerer kontinuerlig brugerovervågning.

Landet med Programmeringen koncentrerer de fleste forbedringerI SWE-bench Verified-evalueringen, som fokuserede på kodning anvendt i virkelige projekter, Sonnet 4.5 fører an med 77,2% (med konfigurationer, der øger antallet under parallel beregning). Anthropic foreslår, at modellen dækker hele udviklingscyklussen: planlægning, implementering, refactoring og vedligeholdelse af store kodebaser.

Ud over ren udvikling, Antropisk identificerer anvendelser, der kræver langvarige flow og koordinering af trin.Fra cybersikkerhed og finans til kontorproduktivitet og forskning ved hjælp af interne og eksterne data. I disse sammenhænge ligger løftet i mere stabile agenter, der er i stand til at opretholde langsigtet arbejde uden at miste konsistens.

Udviklerværktøjer og økosystem

Claude-koden

Lanceringen kommer ledsaget af Nyheder hos Claude Code: kontrolpunkter for at gemme fremskridt og vende tilbage til tidligere tilstande, f.eks. version historie, One opdateret terminalgrænseflade, native udvidelse til Visual Studio Code og forbedringer af kontekst- og hukommelsesredigering via API'en for at køre længere opgaver.

Eksklusivt indhold - Klik her  Hvad er Luma Dream Machine

Antropisk har også premiere på Claude Agent SDK, som replikerer den infrastruktur, virksomheden bruger til at opbygge sine egne agenterKittet tilbyder værktøjer til langtidshukommelse, tilladelsessystemer og koordinering af underagenter, hvilket letter oprettelsen af ​​automatiserede løsninger, der samarbejder mod fælles mål og sikrer forbindelse med værktøjer som f.eks. WireGuard.

Som et supplement, Firmaet aktiverer midlertidigt “Imagine with Claude”en demonstration, der giver os mulighed for at observere, hvordan modellen genererer software i realtid Ingen foruddefineret kode. Denne forhåndsvisning, der er tilgængelig i en begrænset periode for Max-brugere, illustrerer modellens potentiale for interaktiv oprettelse.

Sikkerhed, tilpasning og robusthed

Anthropic inkluderer Sonnet 4.5 i sit beskyttelsesniveau AI-sikkerhedsniveau 3 (ASL-3), med filtre, der er trænet til at detektere farligt indhold, især indhold relateret til CBRN-risici. Virksomheden hævder at have reduceret falske positiver med en faktor ti sammenlignet med den oprindelige version af disse klassifikatorer, og tilbyder Kontinuitet i samtalen med Sonnet 4, hvis der opstår en sikkerhedsspærring.

Samtidig sørger virksomheden for, at Modellen reducerer uønsket adfærd såsom smiger eller vildledende reaktioner og styrker forsvaret mod forsøg på at hurtig indsprøjtningDisse foranstaltninger peger på en brug mere pålidelig i virksomhedsmiljøer, hvor udførelsen af ​​automatiserede handlinger kræver kontrol og sporbarhed.

Eksklusivt indhold - Klik her  Er kunstig intelligens bæredygtig? Dette er den økologiske pris for dens vækst

Tilgængelighed, platforme og priser

Billede af Claude Sonnet 4.5

Claude Sonnet 4.5 er tilgængelig på Claude.ai (web, iOS og Android) og for udviklere via Claude Developer Platform, med integration i tjenester som Amazon Bedrock og Google Cloud Vertex AI. Gratisabonnementet har en sessionsgrænse, der nulstilles hver femte time, og et variabelt antal beskeder efter behov. Priserne forbliver de samme.$3 pr. million input-tokens og $15 pr. million output-tokens.

Blandt de nye adgangsfunktioner, Claudes Chrome-udvidelse rulles ud til Max-brugere. tidligere registreret på venteliste. Selvom benchmarks tyder på betydelige forbedringer i forhold til tidligere iterationer, bemærker Anthropic, at den faktiske ydeevne afhænger af use casen og det ræsonnementsbudget, der er konfigureret for hver opgave.

Med en kombination af fremskridt inden for kodning, større autonomi for agenter og et strengere fokus på sikkerhed, Claude Sonnet 4.5 er positioneret som en solid mulighed for tekniske teams, der har brug for kontinuitet og kontrol i lange processer, opretholdelse af stabile omkostninger og kompatibilitet med Anthropics allerede implementerede økosystem.

LinkedIn-justering AI
relateret artikel:
LinkedIn justerer sin AI: ændringer i privatliv, regioner og hvordan man deaktiverer den