- Inafanya 61,4% katika OSWorld na inaongoza katika SWE-benchi Imethibitishwa
- Hushughulikia kazi ngumu kwa zaidi ya saa 30 na hutoa hadi tokeni 64.000.
- Masasisho ya Msimbo wa Claude na SDK mpya ya Wakala wa Claude kwa mawakala
- Usalama ulioimarishwa (ASL-3) na bei sawa: $3/$15 kwa kila tokeni milioni
Anthropic imetoa Claude Sonnet 4.5, mageuzi yanayolenga upangaji programu, mawakala, na udhibiti wa kompyuta ambayo inalenga kuunganisha jukwaa katika mazingira ya kitaaluma. Katika mazingira yenye wapinzani wa kiwango cha juu, kampuni inaelezea toleo hili kama lake mfano uliosafishwa zaidi na muhimu kwa kazi za uhandisi mpaka tarehe.
Toleo jipya linajengwa kwenye rekodi ya wimbo wa familia ya Sonnet, ambayo tayari ilikuwa imeboresha hoja na kuweka msimbo katika marudio ya awali. Kujengwa juu ya msingi huo, 4.5 inalenga kupanua wigo wa vitendo na maendeleo katika kuendelea kwa umakini, matumizi ya zana, na tija, kudumisha mkakati wa busara katika usalama na upatanishi.
Uwezo muhimu na uboreshaji wa utendaji

Kulingana na Anthropic, Claude Sonnet 4.5 ina uwezo wa kudumisha umakini kwa zaidi ya masaa 30 kwenye kazi ngumu. na hatua nyingi, ambazo zinapendelea miradi mirefu ambapo mwendelezo wa muktadha unahitajika. Pia inasaidia matokeo ya hadi tokeni 64.000 katika jibu moja, na inatoa vidhibiti vya kurekebisha "wakati wa kufikiria" kabla ya kujibu, kusawazisha kasi na maelezo inavyohitajika.
Katika kazi halisi mbele ya kompyuta, Kampuni inaripoti 61,4% katika OSWorld, mruko mkubwa kutoka kwa mtangulizi wake 42,2% katika jaribio hili hili.Katika matukio ya vitendo, mfano unaweza vinjari wavuti, kamilisha lahajedwali, na utekeleze vitendo katika programu za kompyuta za mezani kutoka kwa kiendelezi cha Chrome, kupunguza ufuatiliaji wa mtumiaji unaoendelea.
Ardhi ya Upangaji programu huzingatia zaidi maboresho. Katika tathmini Iliyothibitishwa ya SWE-benchi, ambayo ililenga usimbaji unaotumika kwa miradi ya ulimwengu halisi, Sonnet 4.5 inaongoza kwa 77,2% (na usanidi unaoongeza nambari chini ya kompyuta sambamba). Anthropic inapendekeza kwamba mtindo huo ufunika mzunguko mzima wa maendeleo: kupanga, kutekeleza, kurekebisha, na kudumisha misingi mikubwa ya kanuni.
Zaidi ya maendeleo safi, Anthropic hubainisha matumizi ambayo yanahitaji mtiririko wa muda mrefu na uratibu wa hatua.Kutoka kwa usalama wa mtandao na fedha hadi tija ya ofisi na utafiti kwa kutumia data ya ndani na nje. Katika mazingira haya, ahadi iko katika mawakala thabiti zaidi wenye uwezo wa kuendeleza kazi ya muda mrefu bila kupoteza uthabiti.
Zana za Wasanidi Programu na Mfumo wa Ikolojia

Uzinduzi huo unakuja ukisindikizwa na Nini kipya katika Claude Code: vituo vya ukaguzi kuokoa maendeleo na kurudi katika majimbo yaliyopita, kama vile historia ya toleoMmoja kiolesura cha terminal kilichoboreshwa, kiendelezi asili cha Msimbo wa Visual Studio na uboreshaji wa muktadha na uhariri wa kumbukumbu kupitia API ili kutekeleza majukumu marefu.
Anthropic pia inaonyeshwa kwa mara ya kwanza Claude Agent SDK, ambayo inaiga miundombinu ambayo kampuni hutumia kujenga mawakala wakeSeti hii hutoa zana za kumbukumbu za muda mrefu, mifumo ya ruhusa, na uratibu wa wakala mdogo, kuwezesha uundaji wa suluhisho za kiotomatiki ambazo hushirikiana kuelekea malengo ya kawaida na muunganisho salama wa zana kama vile. WireGuard.
Kama nyongeza, Kampuni hiyo inawezesha kwa muda "Fikiria na Claude", onyesho linalotuwezesha kutazama jinsi kielelezo hicho hutengeneza programu kwa wakati halisi Hakuna msimbo uliofafanuliwa mapema. Onyesho hili la kuchungulia, linapatikana kwa muda mfupi kwa watumiaji wa Max, linaonyesha uwezo wa muundo wa kuunda mwingiliano.
Usalama, usawazishaji na ustahimilivu
Anthropic inajumuisha Sonnet 4.5 katika kiwango chake cha ulinzi Kiwango cha 3 cha Usalama cha AI (ASL-3), na vichungi vilivyofunzwa kutambua maudhui hatari, hasa yanayohusiana na hatari za CBRN. Kampuni hiyo inadai kuwa imepungua chanya za uwongo kwa sababu ya kumi ikilinganishwa na toleo la awali la waainishaji hawa, na matoleo Mwendelezo wa mazungumzo na Sonnet 4 ikiwa kufuli kwa usalama kutatokea.
Sambamba na hilo, kampuni inahakikisha kuwa Mtindo huu hupunguza tabia zisizohitajika kama vile kujipendekeza au majibu ya udanganyifu na kuimarisha ulinzi dhidi ya majaribio ya sindano ya harakaHatua hizi zinaonyesha matumizi kuaminika zaidi katika mazingira ya ushirika, ambapo utekelezaji wa vitendo vya kiotomatiki unahitaji udhibiti na ufuatiliaji.
Upatikanaji, majukwaa na bei

Claude Sonnet 4.5 inapatikana katika Claude.ai (wavuti, iOS na Android) na kwa wasanidi programu kupitia Jukwaa la Wasanidi Programu wa Claude, pamoja na kuunganishwa katika huduma kama vile Amazon Bedrock na Google Cloud Vertex AI. Mpango usiolipishwa hufanya kazi na kikomo cha kipindi ambacho huwekwa upya kila baada ya saa tano na idadi tofauti ya ujumbe unapohitaji. Bei zinabaki sawa.: $ 3 kwa kila tokeni za pembejeo milioni na $ 15 kwa tokeni za pato milioni.
Miongoni mwa vipengele vipya vya ufikiaji, Kiendelezi cha Chrome cha Claude kinapatikana kwa watumiaji wa Max. kusajiliwa hapo awali kwenye orodha ya kusubiri. Ingawa viwango vinapendekeza uboreshaji mkubwa ikilinganishwa na marudio ya awali, Anthropic inabainisha kuwa utendakazi halisi unategemea hali ya matumizi na bajeti ya hoja iliyosanidiwa kwa kila kazi.
Pamoja na mseto wa maendeleo katika usimbaji, uhuru mkubwa kwa mawakala, na kuzingatia usalama zaidi, Claude Sonnet 4.5 imewekwa kama chaguo thabiti kwa timu za kiufundi zinazohitaji mwendelezo na udhibiti katika michakato mirefu, kudumisha gharama thabiti na upatanifu na mfumo ikolojia wa Anthropic ambao tayari umetumwa.
Mimi ni mpenda teknolojia ambaye amegeuza masilahi yake ya "geek" kuwa taaluma. Nimetumia zaidi ya miaka 10 ya maisha yangu kwa kutumia teknolojia ya kisasa na kuchezea kila aina ya programu kwa udadisi mtupu. Sasa nimebobea katika teknolojia ya kompyuta na michezo ya video. Hii ni kwa sababu kwa zaidi ya miaka 5 nimekuwa nikifanya kazi ya kuandika kwenye tovuti mbalimbali za teknolojia na michezo ya video, nikitengeneza makala zinazotaka kukupa taarifa unazohitaji kwa lugha inayoeleweka na kila mtu.
Ikiwa una maswali yoyote, ujuzi wangu unatoka kwa kila kitu kinachohusiana na mfumo wa uendeshaji wa Windows pamoja na Android kwa simu za mkononi. Na ahadi yangu ni kwako, niko tayari kutumia dakika chache na kukusaidia kutatua maswali yoyote ambayo unaweza kuwa nayo katika ulimwengu huu wa mtandao.