Claude Sonnet 4.5: Sprong in codering, agenten en computergebruik

Laatste update: 02/10/2025

  • Het presteert 61,4% in OSWorld en leidt in SWE-bench Verified
  • Verwerkt complexe taken gedurende meer dan 30 uur en genereert tot 64.000 tokens
  • Updates voor Claude Code en de nieuwe Claude Agent SDK voor agenten
  • Verbeterde beveiliging (ASL-3) en dezelfde prijs: $3/$15 per miljoen tokens

Afbeelding van het model Claude Sonnet 4.5

Anthropic heeft Claude Sonnet 4.5 uitgebracht, een evolutie gericht op programmeren, agents en computerbesturing die het platform wil consolideren in professionele omgevingen. In een omgeving met grote rivalen beschrijft het bedrijf deze release als zijn verfijnder en bruikbaarder model voor technische taken Tot op heden

De nieuwe versie bouwt voort op de prestaties van de Sonnet-familie, die in eerdere versies al verbeterde redenering en codering had. Voortbouwend op die basis beoogt versie 4.5 de praktische reikwijdte uit te breiden met verbeteringen in volharding van aandacht, gereedschapsgebruik en productiviteit, waarbij een voorzichtige strategie op het gebied van beveiliging en afstemming wordt gehandhaafd.

Belangrijkste mogelijkheden en prestatieverbeteringen

Generieke afbeelding van Claude Sonnet 4.5

Volgens Anthropic, Claude Sonnet 4.5 kan zich ruim 30 uur lang concentreren op complexe taken. en multi-step, wat lange projecten bevordert waar contextcontinuïteit vereist is. Het ondersteunt ook outputs tot 64.000 tokens in één reactieen biedt bedieningselementen om de ‘denktijd’ aan te passen voordat er wordt gereageerd, waarbij de snelheid en details naar behoefte in balans worden gebracht.

Exclusieve inhoud - Klik hier  YouTube verscherpt beleid tegen massaal geproduceerde en door AI aangestuurde video's

Bij echte taken achter de computer, Het bedrijf rapporteert een score van 61,4% in OSWorld, een opmerkelijke sprong ten opzichte van de 42,2% van zijn voorganger in dezelfde test.In praktische scenario's kan het model surfen op het web, spreadsheets invullen en acties uitvoeren in desktoptoepassingen vanuit de Chrome-extensie, waardoor de continue gebruikersbewaking wordt verminderd.

Het land van Programmeren concentreert de meeste verbeteringenIn de SWE-bench Verified-evaluatie, die zich richtte op codering toegepast op projecten in de echte wereld, Sonnet 4.5 loopt voorop met 77,2% (met configuraties die het aantal verhogen bij parallel computing). Anthropic stelt voor dat het model de gehele ontwikkelingscyclus bestrijkt: planning, implementatie, refactoring en onderhoud van grote codebases.

Naast pure ontwikkeling, Anthropic identificeert toepassingen die langdurige stromen en coördinatie van stappen vereisen.Van cybersecurity en financiën tot kantoorproductiviteit en onderzoek met behulp van interne en externe data: in deze contexten schuilt de belofte in stabielere agents die langdurig werk kunnen volhouden zonder aan consistentie in te boeten.

Ontwikkelaarstools en ecosysteem

Claude-code

De lancering gaat gepaard met Wat is er nieuw bij Claude Code: controlepunten om de voortgang op te slaan en terug te keren naar eerdere toestanden, zoals versie geschiedenis, A vernieuwde terminalinterface, native extensie voor Visual Studio Code en verbeteringen aan context- en geheugenbewerking via de API om langere taken uit te voeren.

Exclusieve inhoud - Klik hier  Antropisch en het geval van de AI die bleekwater aanbeveelt: wanneer modellen vals spelen

Anthropic gaat ook in première met de Claude Agent SDK, die de infrastructuur repliceert die het bedrijf gebruikt om zijn eigen agenten te bouwenDe kit biedt hulpmiddelen voor langetermijngeheugen, toestemmingssystemen en subagentcoördinatie, waardoor het creëren van geautomatiseerde oplossingen die samenwerken aan gemeenschappelijke doelen en veilige connectiviteit met hulpmiddelen zoals WireGuard.

Als aanvulling, Het bedrijf maakt tijdelijk “Imagine with Claude” mogelijk, een demonstratie die ons in staat stelt te observeren hoe het model genereert software in realtime Geen vooraf gedefinieerde code. Deze preview, die voor een beperkte tijd beschikbaar is voor Max-gebruikers, illustreert de mogelijkheden van het model voor interactieve creatie.

Veiligheid, afstemming en veerkracht

Anthropic heeft Sonnet 4.5 opgenomen in zijn beschermingsniveau AI-veiligheidsniveau 3 (ASL-3), met filters die getraind zijn om gevaarlijke inhoud te detecteren, met name inhoud gerelateerd aan CBRN-risico's. Het bedrijf beweert de hoeveelheid vals-positieve resultaten met een factor tien vergeleken met de eerste versie van deze classificatoren, en biedt Continuïteit van het gesprek met Sonnet 4 als er een beveiligingsuitsluiting optreedt.

Tegelijkertijd zorgt het bedrijf ervoor dat Het model vermindert ongewenst gedrag zoals vleierij of misleidende reacties en versterkt de verdediging tegen pogingen om snelle injectieDeze maatregelen wijzen op een gebruik betrouwbaarder in bedrijfsomgevingenwaarbij de uitvoering van geautomatiseerde handelingen controle en traceerbaarheid vereist.

Exclusieve inhoud - Klik hier  Gemini AI kan nu nummers zoals Shazam vinden op je mobiele telefoon

Beschikbaarheid, platforms en prijzen

Afbeelding door Claude Sonnet 4.5

Claude Sonnet 4.5 is beschikbaar op Claude.ai (web, iOS en Android) en voor ontwikkelaars via het Claude Developer Platform, met integratie in diensten zoals Amazon Bedrock en Google Cloud Vertex AI. Het gratis abonnement werkt met een sessielimiet die elke vijf uur wordt gereset en een variabel aantal berichten op aanvraag. De prijzen blijven gelijk.: $3 per miljoen input-tokens en $15 per miljoen output-tokens.

Tot de nieuwe toegangsfuncties behoren: De Chrome-extensie van Claude wordt uitgerold naar Max-gebruikers. eerder op de wachtlijst stonden. Hoewel de benchmarks aanzienlijke verbeteringen suggereren ten opzichte van eerdere iteraties, merkt Anthropic op dat de werkelijke prestaties afhankelijk zijn van de use case en het voor elke taak geconfigureerde redeneringsbudget.

Door een combinatie van vooruitgang in codering, grotere autonomie voor agenten en een striktere focus op beveiliging, Claude Sonnet 4.5 wordt gepositioneerd als een solide optie voor technische teams die continuïteit en controle nodig hebben in lange processen, het handhaven van stabiele kosten en compatibiliteit met het reeds geïmplementeerde ecosysteem van Anthropic.

linkedin aanpassing ai
Gerelateerd artikel:
LinkedIn past zijn AI aan: privacywijzigingen, regio's en hoe u deze kunt uitschakelen