Claude Sonnet 4.5: Salto en Kodado, Agentoj, kaj Komputila Uzo

Lasta ĝisdatigo: 02/10/2025

  • Ĝi plenumas 61,4% en OSWorld kaj estas plej bona en SWE-bench. Verifikita.
  • Pritraktas kompleksajn taskojn dum pli ol 30 horoj kaj generas ĝis 64 000 ĵetonojn
  • Ĝisdatigoj al Claude Code kaj la nova Claude Agent SDK por agentoj
  • Plibonigita sekureco (ASL-3) kaj sama prezo: 3 USD/15 USD por miliono da ĵetonoj

Bildo de la modelo Claude Sonnet 4.5

Anthropic publikigis Claude Sonnet 4.5, evoluon fokusitan al programado, agentoj kaj komputila kontrolo, kiu celas firmigi la platformon en profesiaj medioj. En pejzaĝo kun altnivelaj rivaloj, la kompanio priskribas ĉi tiun eldonon kiel ĝian pli rafinita kaj utila modelo por inĝenieraj taskoj Ĝis nun

La nova versio baziĝas sur la sperto de la Sonnet-familio, kiu jam plibonigis rezonadon kaj kodadon en antaŭaj versioj. Bazante sur tiu fundamento, 4.5 celas plivastigi la praktikan amplekson per progresoj en persisto de atento, iluzo kaj produktiveco, konservante prudentan strategion pri sekureco kaj harmoniigo.

Ŝlosilaj kapabloj kaj plibonigoj de rendimento

Ĝenerala bildo de Claude Sonnet 4.5

Laŭ Antropa, Claude Sonnet 4.5 kapablas konservi fokuson dum pli ol 30 horoj pri kompleksaj taskoj. kaj plurpaŝa, kiu favoras longajn projektojn kie necesas kontinueco de kunteksto. Ĝi ankaŭ subtenas rezultojn de ĝis 64 000 ĵetonoj en ununura respondo, kaj ofertas kontrolojn por alĝustigi la "penstempon" antaŭ respondado, ekvilibrigante rapidon kaj detalon laŭbezone.

Ekskluziva enhavo - Klaku Ĉi tie  YouTube plifortigas sian politikon kontraŭ amasproduktitaj kaj per artefarita inteligenteco funkciigitaj filmetoj

En realaj taskoj antaŭ la komputilo, La kompanio raportas 61,4% en OSWorld, rimarkinda salto kompare kun la 42,2% de sia antaŭulo en ĉi tiu sama testo.En praktikaj scenaroj, la modelo povas foliumi la reton, kompletigi kalkultabelojn, kaj plenumi agojn en labortablaj aplikaĵoj de la Chrome-etendaĵo, reduktante kontinuan uzantan monitoradon.

La lando de Programado koncentras la plej multajn plibonigojnEn la SWE-bench Verified taksado, kiu fokusiĝis al kodado aplikita al realmondaj projektoj, Soneto 4.5 gvidas kun 77,2% (kun konfiguracioj kiuj pliigas la nombron sub paralela komputado). Antropa proponas ke la modelo kovru la tutan disvolviĝan ciklon: planado, efektivigo, refaktorigo kaj prizorgado de grandaj kodbazoj.

Preter pura disvolviĝo, Antropa identigas uzojn, kiuj postulas longedaŭrajn fluojn kaj kunordigon de paŝoj.De cibersekureco kaj financo ĝis oficeja produktiveco kaj esplorado uzante internajn kaj eksterajn datumojn. En ĉi tiuj kuntekstoj, la promeso kuŝas en pli stabilaj agentoj kapablaj subteni longdaŭran laboron sen perdi konsistencon.

Programistaj Iloj kaj Ekosistemo

Claude Code

La lanĉo venas akompanata de Kio estas nova ĉe Claude Code: kontrolpunktoj por konservi progreson kaj reveni al antaŭaj statoj, kiel ekzemple versiohistorio, unu renovigita terminala interfaco, indiĝena etendaĵo por Visual Studio Code kaj plibonigoj al kunteksto kaj memorredaktado per la API por plenumi pli longajn taskojn.

Ekskluziva enhavo - Klaku Ĉi tie  Antropa kaj la kazo de la AI kiu rekomendis trinki blankigilon: kiam modeloj trompas

Antropa ankaŭ premieras la Claude Agent SDK, kiu ripetas la infrastrukturon, kiun la kompanio uzas por konstrui siajn proprajn agentojnLa ilaro proponas ilojn por longtempa memoro, permessistemoj kaj subagenta kunordigo, faciligante la kreadon de aŭtomataj solvoj, kiuj kunlaboras al komunaj celoj kaj sekurigas konekteblecon kun iloj kiel ekzemple WireGuard.

Kiel komplemento, La firmao provizore ebligas "Imagu kun Claude", demonstraĵo kiu permesas al ni observi kiel la modelo generas programaron en reala tempo Neniu antaŭdifinita kodo. Ĉi tiu antaŭrigardo, havebla por limigita tempo al uzantoj de Max, ilustras la potencialon de la modelo por interaga kreado.

Sekureco, akordigo kaj rezisteco

Antropa inkluzivas Soneton 4.5 en sia protektnivelo AI Sekureca Nivelo 3 (ASL-3), kun filtriloj trejnitaj por detekti danĝeran enhavon, precipe tiujn rilatajn al CBRN-riskoj. La kompanio asertas esti reduktinta falsaj pozitivoj je faktoro de dek kompare kun la komenca versio de ĉi tiuj klasifikiloj, kaj ofertas Daŭrigo de konversacio kun Soneto 4 se okazas sekureca ŝlosado.

Paralele, la kompanio certigas, ke La modelo reduktas nedeziratajn kondutojn kiel flatadon aŭ trompajn respondojn kaj plifortigas defendojn kontraŭ provoj prompta injektoĈi tiuj mezuroj indikas uzon pli fidinda en entreprenaj medioj, kie la plenumo de aŭtomataj agoj postulas kontrolojn kaj spureblecon.

Ekskluziva enhavo - Klaku Ĉi tie  Gemini AI nun povas trovi kantojn kiel Shazam de via poŝtelefono

Havebleco, platformoj kaj prezoj

Bildo de Claude Sonnet 4.5

Claude Sonnet 4.5 estas havebla ĉe Claude.ai (reto, iOS kaj Android) kaj por programistoj per la Claude Developer Platform, kun integriĝo en servojn kiel Amazon Bedrock kaj Google Cloud Vertex AI. La senpaga plano funkcias kun seanclimo kiu restariĝas ĉiujn kvin horojn kaj varia nombro da mesaĝoj laŭpete. La prezoj restas la samaj.3 USD por miliono da enigaj ĵetonoj kaj 15 USD por miliono da eligaj ĵetonoj.

Inter la novaj alirfunkcioj, La kromprogramo de Claude por Chrome lanĉiĝas al uzantoj de Max. antaŭe registritaj en la atendolisto. Kvankam la komparnormoj sugestas signifajn plibonigojn kompare kun antaŭaj iteracioj, Anthropic rimarkas, ke la efektiva rendimento dependas de la uzokazo kaj la rezonadbuĝeto agordita por ĉiu tasko.

Kun kombinaĵo de progresoj en kodado, pli granda aŭtonomeco por agentoj, kaj pli strikta fokuso pri sekureco, Claude Sonnet 4.5 estas poziciigita kiel solida opcio por teknikaj teamoj kiuj bezonas kontinuecon kaj kontrolon en longaj procezoj, konservante stabilajn kostojn kaj kongruecon kun la jam deplojita ekosistemo de Anthropic.

LinkedIn-alĝustigo AI
Rilata artikolo:
LinkedIn ĝustigas sian artefaritan inteligentecon: ŝanĝoj pri privateco, regionoj, kaj kiel malŝalti ĝin