- It prestearret 61,4% yn OSWorld en liedt yn SWE-bench Ferifiearre
- Behannelet komplekse taken foar mear as 30 oeren en genereart oant 64.000 tokens
- Updates foar Claude Code en de nije Claude Agent SDK foar aginten
- Ferbettere feiligens (ASL-3) en deselde priis: $3/$15 per miljoen tokens
Anthropic hat Claude Sonnet 4.5 útbrocht, in evolúsje rjochte op programmearjen, aginten en kompjûterkontrôle dy't besiket it platfoarm te konsolidearjen yn profesjonele omjouwings. Yn in lânskip mei rivalen op heech nivo beskriuwt it bedriuw dizze release as syn ... in ferfine en brûkber model foar yngenieurstaken Oant hjoed
De nije ferzje bout fierder op 'e track record fan 'e Sonnet-famylje, dy't redenearring en kodearring al yn eardere iteraasjes ferbettere hie. Bouwend op dy basis, is 4.5 fan doel de praktyske omfang út te wreidzjen mei foarútgong yn oanhâldendheid fan oandacht, arkgebrûk en produktiviteit, it hanthavenjen fan in foarsichtige strategy yn feiligens en ôfstimming.
Wichtige mooglikheden en prestaasjeferbetteringen

Neffens Antropysk, Claude Sonnet 4.5 is by steat om mear as 30 oeren fokus te hâlden op komplekse taken. en mearstaps, wat lange projekten befoarderet wêr't kontinuïteit fan kontekst fereaske is. It stipet ek útfier oant 64.000 tokens yn ien antwurd, en biedt kontrôles om de "tinkentiid" oan te passen foardat der reagearre wurdt, wêrby't snelheid en detail yn lykwicht brocht wurde as nedich.
Yn echte taken foar de kompjûter, It bedriuw rapportearret in 61,4% yn OSWorld, in wichtige sprong fan 'e 42,2% fan syn foargonger yn deselde test.Yn praktyske senario's kin it model blêdzje op it web, foltôgje spreadsheets, en fier aksjes út yn buroblêdapplikaasjes fan 'e Chrome-útwreiding, wêrtroch trochgeande brûkersmonitoring ferminderet.
It lân fan Programmearring konsintrearret de measte ferbetteringenYn 'e SWE-bench Verified evaluaasje, dy't him rjochte op kodearring tapast op projekten yn 'e echte wrâld, Sonnet 4.5 liedt de wei mei 77,2% (mei konfiguraasjes dy't it oantal ferheegje ûnder parallelle berekkening). Anthropic stelt foar dat it model de hiele ûntwikkelingssyklus beslacht: planning, ymplemintaasje, refactoring en ûnderhâld fan grutte koadebases.
Utsein pure ûntwikkeling, Antropysk identifisearret gebrûk dy't langere streamingen en koördinaasje fan stappen fereaskje.Fan cyberfeiligens en finânsjes oant kantoarproduktiviteit en ûndersyk mei ynterne en eksterne gegevens. Yn dizze konteksten leit de belofte yn stabiler aginten dy't by steat binne om langduorjend wurk te folhâlden sûnder konsistinsje te ferliezen.
Untwikkeldersark en ekosysteem

De lansearring komt mei Wat is nij by Claude Code: kontrolepunten om foarútgong te bewarjen en werom te gean nei foarige steaten, lykas ferzjeshistoarje, ien fernijde terminalynterface, native útwreiding foar Visual Studio Code en ferbetteringen oan kontekst- en ûnthâldbewurking fia de API om langere taken út te fieren.
Antropysk hat ek premiêres Claude Agent SDK, dy't de ynfrastruktuer replikearret dy't it bedriuw brûkt om syn eigen aginten te bouwenDe kit biedt ark foar lange-termyn ûnthâld, tastimmingssystemen en subagintkoördinaasje, wêrtroch't it mooglik is om automatisearre oplossingen te meitsjen dy't gearwurkje oan mienskiplike doelen en feilige ferbining mei ark lykas WireGuard.
As oanfolling, It bedriuw makket tydlik "Imagine with Claude" mooglik, in demonstraasje dy't ús mooglik makket om te observearjen hoe't it model genereart software yn realtime Gjin foarôf definieare koade. Dizze foarbyld, beskikber foar in beheinde tiid foar Max-brûkers, yllustrearret it potinsjeel fan it model foar ynteraktive skepping.
Feiligens, ôfstimming en fearkrêft
Anthropic omfettet Sonnet 4.5 yn syn beskermingsnivo AI Feiligensnivo 3 (ASL-3), mei filters dy't traind binne om gefaarlike ynhâld te detektearjen, foaral dyjingen dy't relatearre binne oan CBRN-risiko's. It bedriuw beweart dat se fermindere hawwe falske positiven mei in faktor tsien yn ferliking mei de earste ferzje fan dizze klassifikatoaren, en biedt Kontinuïteit fan petear mei Sonnet 4 as in befeiligingsútsluting foarkomt.
Parallel soarget it bedriuw derfoar dat It model ferminderet ûnwinske gedrach lykas flattering of misleidende reaksjes en fersterket ferdigeningswurken tsjin pogingen om prompt ynjeksjeDizze maatregels wize op in gebrûk betrouberder yn bedriuwsomjouwings, wêrby't de útfiering fan automatisearre aksjes kontrôles en traceerberens fereasket.
Beskikberens, platfoarms en prizen

Claude Sonnet 4.5 is beskikber op Claude.ai (web, iOS en Android) en foar ûntwikkelders fia it Claude Developer Platform, mei yntegraasje yn tsjinsten lykas Amazon Bedrock en Google Cloud Vertex AI. It fergese plan wurket mei in sesjelimyt dy't elke fiif oeren weromset wurdt en in fariabele oantal berjochten op oanfraach. Prizen bliuwe itselde.$3 per miljoen ynfiertokens en $15 per miljoen útfiertokens.
Under de nije tagongsfunksjes, De Chrome-útwreiding fan Claude wurdt útrôle nei Max-brûkers. earder registrearre op 'e wachtlist. Hoewol de benchmarks substansjele ferbetteringen suggerearje yn ferliking mei eardere iteraasjes, merkt Anthropic op dat de werklike prestaasjes ôfhinklik binne fan 'e gebrûksgefal en it redenearringsbudzjet dat foar elke taak konfigurearre is.
Mei in kombinaasje fan foarútgong yn kodearring, gruttere autonomy foar aginten, en in strangere fokus op feiligens, Claude Sonnet 4.5 wurdt posysjonearre as in solide opsje foar technyske teams dy't kontinuïteit en kontrôle nedich hawwe yn lange prosessen, it behâld fan stabile kosten en kompatibiliteit mei it al ynset ekosysteem fan Anthropic.
Ik bin in technology-entûsjast dy't syn "geek" ynteresses hat omset yn in berop. Ik haw mear as 10 jier fan myn libben bestege oan it brûken fan moderne technology en oan allerhande programma's út pure nijsgjirrigens te tinken. No haw ik my spesjalisearre yn kompjûtertechnology en fideospultsjes. Dit is om't ik mear dan 5 jier wurke oan skriuwen foar ferskate websiden oer technology en fideospultsjes, artikels oanmeitsje dy't besykje jo de ynformaasje te jaan dy't jo nedich binne yn in taal dy't elkenien begrypt.
As jo fragen hawwe, rint myn kennis fan alles relatearre oan it Windows-bestjoeringssysteem as Android foar mobile tillefoans. En myn ynset is foar jo, ik bin altyd ree om in pear minuten te besteegjen en jo te helpen mei it oplossen fan alle fragen dy't jo hawwe yn dizze ynternetwrâld.