Claude Sonnet 4.5: Kode-, Agent- en Sekuriteitsverbeterings

Dit presteer 61,4% in OSWorld en lei in SWE-bench Geverifieer
Hanteer komplekse take vir meer as 30 uur en genereer tot 64 000 tokens
Opdaterings aan Claude Code en die nuwe Claude Agent SDK vir agente
Verbeterde sekuriteit (ASL-3) en dieselfde prys: $3/$15 per miljoen tokens

Beeld van die Claude Sonnet 4.5-model

Anthropic het Claude Sonnet 4.5 vrygestel, 'n evolusie gefokus op programmering, agente en rekenaarbeheer wat poog om die platform in professionele omgewings te konsolideer. In 'n landskap met hoëvlak-mededingers beskryf die maatskappy hierdie vrystelling as sy ... meer verfynde en bruikbare model vir ingenieurstake Tot op datum

Die nuwe weergawe bou voort op die prestasiegeskiedenis van die Sonnet-familie, wat reeds redenasie en kodering in vorige weergawes verbeter het. Voortbouend op daardie fondament, beoog 4.5 om die praktiese omvang uit te brei met vooruitgang in volharding van aandag, gereedskapgebruik en produktiwiteit, en handhaaf 'n verstandige strategie in sekuriteit en belyning.

Belangrike vermoëns en prestasieverbeterings

Generiese beeld van Claude Sonnet 4.5

Volgens Antropiese, Claude Sonnet 4.5 is in staat om meer as 30 uur lank fokus op komplekse take te handhaaf. en meerstapig, wat lang projekte bevoordeel waar kontinuïteit van konteks vereis word. Dit ondersteun ook uitsette van tot 64 000 tekens in 'n enkele reaksie, en bied kontroles om die "denktyd" voor reaksie aan te pas, en balanseer spoed en detail soos nodig.

Eksklusiewe inhoud - Klik hier Hoe om Copilot Vision op Edge te gebruik: kenmerke en wenke

In werklike take voor die rekenaar, Die maatskappy rapporteer 'n 61,4% in OSWorld, 'n noemenswaardige sprong van sy voorganger se 42,2% in dieselfde toets.In praktiese scenario's kan die model blaai deur die web, voltooi sigblaaie en voer aksies uit in lessenaartoepassings vanaf die Chrome-uitbreiding, wat deurlopende gebruikersmonitering verminder.

Die land van Programmering konsentreer die meeste van die verbeteringsIn die SWE-bench Geverifieerde evaluering, wat gefokus het op kodering toegepas op werklike projekte, Sonnet 4.5 lei die voortou met 77,2% (met konfigurasies wat die getal onder parallelle berekening verhoog). Anthropic stel voor dat die model die hele ontwikkelingsiklus dek: beplanning, implementering, herstrukturering en instandhouding van groot kodebasisse.

Verder as suiwer ontwikkeling, Antropies identifiseer gebruike wat langdurige vloei en koördinering van stappe vereis.Van kuberveiligheid en finansies tot kantoorproduktiwiteit en navorsing met behulp van interne en eksterne data. In hierdie kontekste lê die belofte in meer stabiele agente wat langtermynwerk kan volhou sonder om konsekwentheid te verloor.

Ontwikkelaarshulpmiddels en ekosisteem

Claude-kode

Die bekendstelling gaan gepaard met Wat is nuut by Claude Code: kontrolepunte om vordering te stoor en terug te keer na vorige toestande, soos weergawe geskiedenis, Een opgeknapte terminaalkoppelvlak, inheemse uitbreiding vir Visual Studio Code en verbeterings aan konteks- en geheuebewerking via die API om langer take uit te voer.

Eksklusiewe inhoud - Klik hier Wat is Luma Dream Machine

Antropiese première ook die Claude Agent SDK, wat die infrastruktuur wat die maatskappy gebruik om sy eie agente te bou, herhaalDie stel bied gereedskap vir langtermyngeheue, toestemmingstelsels en subagent-koördinering, wat die skep van outomatiese oplossings vergemaklik wat saamwerk aan gemeenskaplike doelwitte en veilige konnektiwiteit met gereedskap soos WireGuard.

As 'n aanvulling, Die firma maak tydelik “Imagine with Claude” moontlik, 'n demonstrasie wat ons toelaat om te sien hoe die model genereer sagteware intyds Geen voorafbepaalde kode nie. Hierdie voorskou, beskikbaar vir 'n beperkte tyd vir Max-gebruikers, illustreer die model se potensiaal vir interaktiewe skepping.

Sekuriteit, belyning en veerkragtigheid

Anthropic sluit Sonnet 4.5 in sy beskermingsvlak in KI-veiligheidsvlak 3 (ASL-3), met filters wat opgelei is om gevaarlike inhoud op te spoor, veral dié wat verband hou met CBRN-risiko's. Die maatskappy beweer dat hulle verminder het vals positiewe met 'n faktor van tien in vergelyking met die aanvanklike weergawe van hierdie klassifiseerders, en bied Kontinuïteit van gesprek met Sonnet 4 indien 'n sekuriteitsuitsluiting plaasvind.

Terselfdertyd verseker die maatskappy dat Die model verminder ongewenste gedrag soos vleiery of misleidende reaksies en versterk verdediging teen pogings om vinnige inspuitingHierdie maatreëls dui op 'n gebruik meer betroubaar in korporatiewe omgewings, waar die uitvoering van outomatiese aksies beheermaatreëls en naspeurbaarheid vereis.

Eksklusiewe inhoud - Klik hier Is kunsmatige intelligensie volhoubaar? Dit is die ekologiese prys van sy groei

Beskikbaarheid, platforms en pryse

Beeld deur Claude Sonnet 4.5

Claude Sonnet 4.5 is beskikbaar by Claude.ai (web, iOS en Android) en vir ontwikkelaars via die Claude-ontwikkelaarplatform, met integrasie in dienste soos Amazon Bedrock en Google Cloud Vertex AI. Die gratis plan werk met 'n sessielimiet wat elke vyf uur herstel word en 'n veranderlike aantal boodskappe op aanvraag. Pryse bly dieselfde.$3 per miljoen invoertokens en $15 per miljoen uitvoertokens.

Onder die nuwe toegangskenmerke, Claude se Chrome-uitbreiding word uitgerol na Max-gebruikers. voorheen op die waglys geregistreer. Alhoewel die maatstawwe aansienlike verbeterings in vergelyking met vorige iterasies voorstel, merk Anthropic op dat werklike prestasie afhang van die gebruiksgeval en die redenasiebegroting wat vir elke taak gekonfigureer is.

Met 'n kombinasie van vooruitgang in kodering, groter outonomie vir agente en 'n strenger fokus op sekuriteit, Claude Sonnet 4.5 word as 'n soliede opsie geposisioneer. vir tegniese spanne wat kontinuïteit en beheer in lang prosesse benodig, die handhawing van stabiele koste en versoenbaarheid met Anthropic se reeds ontplooide ekosisteem.

Verwante artikel:

LinkedIn pas sy KI aan: privaatheidsveranderinge, streke en hoe om dit te deaktiveer

Alberto navarro

Ek is 'n tegnologie-entoesias wat sy "geek"-belangstellings in 'n beroep verander het. Ek het meer as 10 jaar van my lewe bestee om die nuutste tegnologie te gebruik en uit pure nuuskierigheid met allerhande programme te peuter. Nou het ek gespesialiseer in rekenaartegnologie en videospeletjies. Dit is omdat ek al vir meer as 5 jaar vir verskeie webwerwe oor tegnologie en videospeletjies skryf en artikels skep wat poog om jou die inligting te gee wat jy nodig het in 'n taal wat vir almal verstaanbaar is.

As jy enige vrae het, strek my kennis van alles wat verband hou met die Windows-bedryfstelsel sowel as Android vir selfone. En my verbintenis is aan jou, ek is altyd bereid om 'n paar minute te spandeer en jou te help om enige vrae op te los wat jy in hierdie internetwêreld mag hê.