- Það skilar 61,4% árangri í OSWorld og er efst í SWE-bekk.
- Tekur á flóknum verkefnum í meira en 30 klukkustundir og býr til allt að 64.000 tákn
- Uppfærslur á Claude Code og nýja Claude Agent SDK fyrir umboðsmenn
- Aukið öryggi (ASL-3) og sama verð: $3/$15 á hverja milljón tákn
Anthropic hefur gefið út Claude Sonnet 4.5, þróunarverkefni sem einblínir á forritun, umboðsmenn og tölvustýringu og miðar að því að styrkja kerfið í faglegum umhverfum. Í landslagi með stórum samkeppnisaðilum lýsir fyrirtækið þessari útgáfu sem sinni... fágaðri og gagnlegri gerð fyrir verkfræðiverkefni til þessa.
Nýja útgáfan byggir á reynslu Sonnet fjölskyldunnar, sem hafði þegar bætt rökhugsun og forritun í fyrri útgáfum. Byggjandi á þeim grunni miðar 4.5 að því að auka hagnýtt umfang með framförum í Þrautseigja í athygli, notkun verkfæra og framleiðni, að viðhalda skynsamlegri stefnu í öryggi og samræmingu.
Lykilgetu og úrbætur á afköstum

Samkvæmt Mannfræði, Claude Sonnet 4.5 er fær um að viðhalda einbeitingu í meira en 30 klukkustundir við flókin verkefni. og fjölþrepa, sem ýtir undir löng verkefni þar sem samfelldni samhengis er nauðsynleg. Það styður einnig afköst allt að 64.000 tákn í einu svariog býður upp á stjórntæki til að stilla „umhugsunartímann“ áður en svarað er, og vegur hraða og smáatriði eftir þörfum.
Í raunverulegum verkefnum fyrir framan tölvuna, Fyrirtækið greinir frá 61,4% í OSWorld, sem er töluverð aukning frá 42,2% fyrirrennara síns í sömu prófun.Í raunlegum aðstæðum getur líkanið vafra um vefinn, fylla út töflureikna og framkvæma aðgerðir í skrifborðsforritum úr Chrome viðbótinni, sem dregur úr stöðugu eftirliti notenda.
Landið af Forritun einbeitir sér að flestum úrbótumÍ SWE-bench Verified matinu, sem einbeitti sér að forritun sem notuð var í raunverulegum verkefnum, Sonnet 4.5 er efst með 77,2% atkvæða. (með stillingum sem auka fjölda við samsíða útreikninga). Anthropic leggur til að líkanið nái yfir allan þróunarferilinn: skipulagning, innleiðing, endurgerð og viðhald stórra kóðagrunna.
Umfram hreina þróun, Mannfræðin greinir notkun sem krefst langvarandi flæðis og samhæfingar skrefa.Frá netöryggi og fjármálum til framleiðni á skrifstofum og rannsókna með því að nota innri og ytri gögn. Í þessu samhengi felst loforð í stöðugri aðilum sem geta haldið uppi langtímavinnu án þess að missa samræmi.
Verkfæri forritara og vistkerfi

Útgáfunni fylgir Hvað er nýtt hjá Claude Code: eftirlitsstöðvar til að vista framfarir og fara aftur í fyrri stöður, svo sem útgáfuferill, A endurbætt tengi við flugstöðina, innbyggð viðbót fyrir Visual Studio Code og úrbætur á samhengis- og minnisbreytingum í gegnum API til að keyra lengri verkefni.
Anthropic frumsýnir einnig Claude Agent SDK, sem endurtekur innviðina sem fyrirtækið notar til að byggja upp sína eigin umboðsmennPakkinn býður upp á verkfæri fyrir langtímaminni, leyfiskerfi og samhæfingu undirumboðsmanna, sem auðveldar sköpun sjálfvirkra lausna sem vinna saman að sameiginlegum markmiðum og tryggja örugga tengingu við verkfæri eins og WireGuard.
Sem viðbót, Fyrirtækið gerir tímabundið „Ímyndaðu þér með Claude“ kleift, sýnikennsla sem gerir okkur kleift að fylgjast með hvernig líkanið býr til hugbúnað í rauntíma Enginn fyrirfram skilgreindur kóði. Þessi forskoðun, sem er í boði í takmarkaðan tíma fyrir Max notendur, sýnir fram á möguleika líkansins til gagnvirkrar sköpunar.
Öryggi, samræming og seigla
Anthropic hefur Sonnet 4.5 í verndarstigi sínu Öryggisstig 3 í gervigreind (ASL-3), með síum sem eru þjálfaðar til að greina hættulegt efni, sérstaklega það sem tengist CBRN-áhættu. Fyrirtækið fullyrðir að hafa dregið úr falskar jákvæðar niðurstöður tífalt samanborið við upphaflegu útgáfu þessara flokkara og býður upp á Samfelld samskipti við Sonnet 4 ef öryggislæsing á sér stað.
Samhliða því tryggir fyrirtækið að Líkanið dregur úr óæskilegri hegðun eins og smjaðri eða blekkjandi viðbrögðum og styrkir varnir gegn tilraunum til að skjóta inndælinguÞessar ráðstafanir benda til notkunar áreiðanlegri í fyrirtækjaumhverfi, þar sem framkvæmd sjálfvirkra aðgerða krefst eftirlits og rekjanleika.
Framboð, kerfi og verð

Claude Sonnet 4.5 er fáanlegt á Claude.ai (vefur, iOS og Android) og fyrir forritara í gegnum Claude Developer Platform, með samþættingu við þjónustu eins og Amazon Bedrock og Google Cloud Vertex AI. Ókeypis áskriftin býður upp á lotutakmörk sem endurstillast á fimm tíma fresti og breytilegan fjölda skilaboða eftir þörfum. Verðin eru óbreytt.3 dollarar á hverja milljón inntaksmerki og 15 dollarar á hverja milljón úttaksmerki.
Meðal nýrra aðgangseiginleika, Chrome viðbótin fyrir Claude er að koma út fyrir Max notendur. áður skráður á biðlista. Þó að viðmiðunarprófin bendi til verulegra úrbóta samanborið við fyrri útgáfur, bendir Anthropic á að raunveruleg frammistaða veltur á notkunartilfellinu og rökstuðningi fyrir fjárhagsáætlun sem er stillt fyrir hvert verkefni.
Með blöndu af framförum í kóðun, meira sjálfstæði umboðsmanna og strangari áherslu á öryggi, Claude Sonnet 4.5 er talinn vera traustur kostur. fyrir tækniteymi sem þurfa samfellu og stjórn í löngum ferlum, að viðhalda stöðugum kostnaði og samhæfni við vistkerfi Anthropic sem þegar er komið á fót.
Ég er tækniáhugamaður sem hefur breytt "nörda" áhugamálum sínum í fag. Ég hef eytt meira en 10 árum af lífi mínu í að nota háþróaða tækni og fikta í alls kyns forritum af einskærri forvitni. Nú hef ég sérhæft mig í tölvutækni og tölvuleikjum. Þetta er vegna þess að í meira en 5 ár hef ég skrifað fyrir ýmsar vefsíður um tækni og tölvuleiki, búið til greinar sem leitast við að veita þér þær upplýsingar sem þú þarft á tungumáli sem er skiljanlegt fyrir alla.
Ef þú hefur einhverjar spurningar þá nær þekking mín frá öllu sem tengist Windows stýrikerfinu sem og Android fyrir farsíma. Og skuldbinding mín er til þín, ég er alltaf tilbúin að eyða nokkrum mínútum og hjálpa þér að leysa allar spurningar sem þú gætir haft í þessum internetheimi.