Claude Sonnet 4.5: Stökk í forritun, umboðsmönnum og tölvunotkun

Síðasta uppfærsla: 02/10/2025

  • Það skilar 61,4% árangri í OSWorld og er efst í SWE-bekk.
  • Tekur á flóknum verkefnum í meira en 30 klukkustundir og býr til allt að 64.000 tákn
  • Uppfærslur á Claude Code og nýja Claude Agent SDK fyrir umboðsmenn
  • Aukið öryggi (ASL-3) og sama verð: $3/$15 á hverja milljón tákn

Mynd af Claude Sonnet 4.5 líkaninu

Anthropic hefur gefið út Claude Sonnet 4.5, þróunarverkefni sem einblínir á forritun, umboðsmenn og tölvustýringu og miðar að því að styrkja kerfið í faglegum umhverfum. Í landslagi með stórum samkeppnisaðilum lýsir fyrirtækið þessari útgáfu sem sinni... fágaðri og gagnlegri gerð fyrir verkfræðiverkefni til þessa.

Nýja útgáfan byggir á reynslu Sonnet fjölskyldunnar, sem hafði þegar bætt rökhugsun og forritun í fyrri útgáfum. Byggjandi á þeim grunni miðar 4.5 að því að auka hagnýtt umfang með framförum í Þrautseigja í athygli, notkun verkfæra og framleiðni, að viðhalda skynsamlegri stefnu í öryggi og samræmingu.

Lykilgetu og úrbætur á afköstum

Almenn mynd af Claude Sonnet 4.5

Samkvæmt Mannfræði, Claude Sonnet 4.5 er fær um að viðhalda einbeitingu í meira en 30 klukkustundir við flókin verkefni. og fjölþrepa, sem ýtir undir löng verkefni þar sem samfelldni samhengis er nauðsynleg. Það styður einnig afköst allt að 64.000 tákn í einu svariog býður upp á stjórntæki til að stilla „umhugsunartímann“ áður en svarað er, og vegur hraða og smáatriði eftir þörfum.

Einkarétt efni - Smelltu hér  YouTube herðir stefnu sína gegn fjöldaframleiddum og gervigreindarknúnum myndböndum.

Í raunverulegum verkefnum fyrir framan tölvuna, Fyrirtækið greinir frá 61,4% í OSWorld, sem er töluverð aukning frá 42,2% fyrirrennara síns í sömu prófun.Í raunlegum aðstæðum getur líkanið vafra um vefinn, fylla út töflureikna og framkvæma aðgerðir í skrifborðsforritum úr Chrome viðbótinni, sem dregur úr stöðugu eftirliti notenda.

Landið af Forritun einbeitir sér að flestum úrbótumÍ SWE-bench Verified matinu, sem einbeitti sér að forritun sem notuð var í raunverulegum verkefnum, Sonnet 4.5 er efst með 77,2% atkvæða. (með stillingum sem auka fjölda við samsíða útreikninga). Anthropic leggur til að líkanið nái yfir allan þróunarferilinn: skipulagning, innleiðing, endurgerð og viðhald stórra kóðagrunna.

Umfram hreina þróun, Mannfræðin greinir notkun sem krefst langvarandi flæðis og samhæfingar skrefa.Frá netöryggi og fjármálum til framleiðni á skrifstofum og rannsókna með því að nota innri og ytri gögn. Í þessu samhengi felst loforð í stöðugri aðilum sem geta haldið uppi langtímavinnu án þess að missa samræmi.

Verkfæri forritara og vistkerfi

Claude Code

Útgáfunni fylgir Hvað er nýtt hjá Claude Code: eftirlitsstöðvar til að vista framfarir og fara aftur í fyrri stöður, svo sem útgáfuferill, A endurbætt tengi við flugstöðina, innbyggð viðbót fyrir Visual Studio Code og úrbætur á samhengis- og minnisbreytingum í gegnum API til að keyra lengri verkefni.

Einkarétt efni - Smelltu hér  Mannfræðin og málið um gervigreindina sem mælti með því að drekka bleikiefni: þegar fyrirsætur svindla

Anthropic frumsýnir einnig Claude Agent SDK, sem endurtekur innviðina sem fyrirtækið notar til að byggja upp sína eigin umboðsmennPakkinn býður upp á verkfæri fyrir langtímaminni, leyfiskerfi og samhæfingu undirumboðsmanna, sem auðveldar sköpun sjálfvirkra lausna sem vinna saman að sameiginlegum markmiðum og tryggja örugga tengingu við verkfæri eins og WireGuard.

Sem viðbót, Fyrirtækið gerir tímabundið „Ímyndaðu þér með Claude“ kleift, sýnikennsla sem gerir okkur kleift að fylgjast með hvernig líkanið býr til hugbúnað í rauntíma Enginn fyrirfram skilgreindur kóði. Þessi forskoðun, sem er í boði í takmarkaðan tíma fyrir Max notendur, sýnir fram á möguleika líkansins til gagnvirkrar sköpunar.

Öryggi, samræming og seigla

Anthropic hefur Sonnet 4.5 í verndarstigi sínu Öryggisstig 3 í gervigreind (ASL-3), með síum sem eru þjálfaðar til að greina hættulegt efni, sérstaklega það sem tengist CBRN-áhættu. Fyrirtækið fullyrðir að hafa dregið úr falskar jákvæðar niðurstöður tífalt samanborið við upphaflegu útgáfu þessara flokkara og býður upp á Samfelld samskipti við Sonnet 4 ef öryggislæsing á sér stað.

Samhliða því tryggir fyrirtækið að Líkanið dregur úr óæskilegri hegðun eins og smjaðri eða blekkjandi viðbrögðum og styrkir varnir gegn tilraunum til að skjóta inndælinguÞessar ráðstafanir benda til notkunar áreiðanlegri í fyrirtækjaumhverfi, þar sem framkvæmd sjálfvirkra aðgerða krefst eftirlits og rekjanleika.

Einkarétt efni - Smelltu hér  Gemini AI getur nú fundið lög eins og Shazam úr farsímanum þínum

Framboð, kerfi og verð

Mynd eftir Claude Sonnet 4.5

Claude Sonnet 4.5 er fáanlegt á Claude.ai (vefur, iOS og Android) og fyrir forritara í gegnum Claude Developer Platform, með samþættingu við þjónustu eins og Amazon Bedrock og Google Cloud Vertex AI. Ókeypis áskriftin býður upp á lotutakmörk sem endurstillast á fimm tíma fresti og breytilegan fjölda skilaboða eftir þörfum. Verðin eru óbreytt.3 dollarar á hverja milljón inntaksmerki og 15 dollarar á hverja milljón úttaksmerki.

Meðal nýrra aðgangseiginleika, Chrome viðbótin fyrir Claude er að koma út fyrir Max notendur. áður skráður á biðlista. Þó að viðmiðunarprófin bendi til verulegra úrbóta samanborið við fyrri útgáfur, bendir Anthropic á að raunveruleg frammistaða veltur á notkunartilfellinu og rökstuðningi fyrir fjárhagsáætlun sem er stillt fyrir hvert verkefni.

Með blöndu af framförum í kóðun, meira sjálfstæði umboðsmanna og strangari áherslu á öryggi, Claude Sonnet 4.5 er talinn vera traustur kostur. fyrir tækniteymi sem þurfa samfellu og stjórn í löngum ferlum, að viðhalda stöðugum kostnaði og samhæfni við vistkerfi Anthropic sem þegar er komið á fót.

LinkedIn aðlögun gervigreind
Tengd grein:
LinkedIn aðlagar gervigreind sína: breytingar á friðhelgi einkalífs, svæði og hvernig á að slökkva á henni