- OSWorldi edetabelis on selle tulemus 61,4% ja see on SWE-bench Verifiedi edetabelis esikohal.
- Täidab keerulisi ülesandeid enam kui 30 tunni jooksul ja genereerib kuni 64 000 žetooni
- Claude'i koodi ja uue Claude'i agendi SDK värskendused agentidele
- Täiustatud turvalisus (ASL-3) ja sama hind: 3/15 dollarit miljoni žetooni kohta
Anthropic on välja andnud Claude Sonnet 4.5, mis on programmeerimisele, agentidele ja arvutijuhtimisele keskendunud evolutsiooniversioon, mille eesmärk on platvormi konsolideerimine professionaalses keskkonnas. Maastikus, kus on kõrgetasemelisi konkurente, kirjeldab ettevõte seda versiooni kui oma... rafineeritum ja kasulikum mudel inseneriülesannete jaoks siiani.
Uus versioon tugineb Sonneti perekonna varasematele tulemustele, mis olid juba varasemates versioonides parandanud arutluskäiku ja kodeerimist. Sellele alusele tuginedes on versiooni 4.5 eesmärk laiendada praktilist ulatust edusammudega järgmistes valdkondades: tähelepanu püsivus, tööriistade kasutamine ja tootlikkus, säilitades turvalisuse ja ühtlustamise osas ettevaatliku strateegia.
Peamised võimalused ja jõudluse täiustused

Antroopilise teooria kohaselt Claude Sonnet 4.5 suudab keeruliste ülesannete puhul keskenduda enam kui 30 tundi. ja mitmeastmeline, mis soosib pikki projekte, kus konteksti järjepidevus on vajalik. See toetab ka kuni 64 000 žetooni ühes vastusesning pakub juhtnuppe vastamisele eelneva „mõtlemisaja” reguleerimiseks, tasakaalustades vastavalt vajadusele kiirust ja detaile.
Päris ülesannete täitmisel arvuti ees, Ettevõte teatab OSWorldis 61,4%-st, mis on märkimisväärne hüpe võrreldes eelkäija 42,2%-ga samas testis.Praktilistes olukordades saab mudel sirvida veebi, täita arvutustabeleid ja teha toiminguid Chrome'i laienduse töölauarakendustes, vähendades pidevat kasutajate jälgimist.
Maa Programmeerimine koondab suurema osa täiustustestSWE-bench Verified hindamises, mis keskendus reaalsetes projektides rakendatud kodeerimisele, Sonnet 4.5 on 77,2%-ga eesotsas. (konfiguratsioonidega, mis suurendavad arvu paralleelarvutuse korral). Antroopiline pakub välja, et mudel hõlmab kogu arendustsüklit: suurte koodibaaside planeerimine, rakendamine, refaktoreerimine ja hooldus.
Lisaks puhtale arengule, Antroopiline määratleb kasutusviisid, mis nõuavad pikaajalisi vooge ja sammude koordineerimist.Alates küberturvalisusest ja rahandusest kuni kontoritöö tootlikkuse ja sise- ja välisandmeid kasutavate uuringuteni. Nendes kontekstides peitub potentsiaali stabiilsemates agentides, mis suudavad pikaajalist tööd järjepidevust kaotamata teha.
Arendaja tööriistad ja ökosüsteem

Käivitusega kaasneb Mis on Claude Code'is uut?: kontrollpunktid edenemise salvestamiseks ja eelmistesse olekutesse naasmiseks, näiteks versiooni ajalugu, Üks uuendatud terminaliliides, Visual Studio koodi natiivne laiendus ja konteksti ja mälu redigeerimise täiustused API kaudu pikemate ülesannete käitamiseks.
Antroopilises esilinastusel on ka Claude'i agendi SDK, mis kopeerib infrastruktuuri, mida ettevõte kasutab oma agentide loomiseksKomplekt pakub tööriistu pikaajaliseks mäluks, lubade süsteemideks ja subagentide koordineerimiseks, hõlbustades automatiseeritud lahenduste loomist, mis teevad koostööd ühiste eesmärkide saavutamiseks ja turvalise ühenduvuse tagamiseks selliste tööriistadega nagu WireGuard.
Täiendusena Firma võimaldab ajutiselt funktsiooni „Imagine with Claude”, demonstratsioon, mis võimaldab meil jälgida, kuidas mudel genereerib tarkvara reaalajas Eelmääratletud koodi pole. See eelvaade, mis on piiratud aja jooksul saadaval Maxi kasutajatele, illustreerib mudeli interaktiivse loomise potentsiaali.
Turvalisus, kooskõla ja vastupidavus
Anthropic sisaldab oma kaitsetasemes Sonnet 4.5 Tehisintellekti ohutustase 3 (ASL-3), filtritega, mis on treenitud tuvastama ohtlikku sisu, eriti CBRN-riskidega seotud sisu. Ettevõte väidab, et on vähendanud valepositiivseid kümnekordselt võrreldes nende klassifikaatorite algversiooniga ja pakub Vestluse jätkumine Sonnet 4-ga turvalukustuse korral.
Samal ajal tagab ettevõte, et Mudel vähendab soovimatut käitumist, nagu meelitused või petlikud reaktsioonid, ja tugevdab kaitset katsete vastu. kiire süstimineNeed meetmed viitavad kasutamisele usaldusväärsem ettevõttekeskkonnas, kus automatiseeritud toimingute teostamine nõuab kontrolli ja jälgitavust.
Saadavus, platvormid ja hinnad

Claude Sonnet 4.5 on saadaval Claude.ai-s (veeb, iOS ja Android) ja arendajatele Claude'i arendajaplatvormi kaudu, integreerides selle selliste teenustega nagu Amazon Bedrock ja Google Cloud Vertex AI. Tasuta pakett töötab seansi limiidiga, mis lähtestatakse iga viie tunni järel, ja muutuva arvu sõnumitega vastavalt nõudmisele. Hinnad jäävad samaks.3 dollarit miljoni sisendtokeni ja 15 dollarit miljoni väljundtokeni kohta.
Uute juurdepääsufunktsioonide hulgas on Claude'i Chrome'i laiendust hakatakse tegema Maxi kasutajatele. varem ootenimekirjas registreeritud. Kuigi võrdlusnäitajad viitavad varasemate iteratsioonidega võrreldes märkimisväärsele paranemisele, märgib Anthropic, et tegelik jõudlus sõltub kasutusjuhtumist ja iga ülesande jaoks konfigureeritud arutluskäigu eelarvest.
Kodeerimise edusammude, agentide suurema autonoomia ja rangema turvalisusele keskendumise kombinatsiooniga Claude Sonnet 4.5 on positsioneeritud kindla valikuna tehnilistele meeskondadele, kes vajavad pikkade protsesside käigus järjepidevust ja kontrolli, stabiilsete kulude ja ühilduvuse säilitamine Anthropici juba kasutusele võetud ökosüsteemiga.
Olen tehnoloogiahuviline, kes on muutnud oma "nohikese" huvidest elukutse. Olen veetnud üle 10 aasta oma elust tipptehnoloogiat kasutades ja puhtast uudishimust igasuguste programmide kallal nokitsenud. Nüüd olen spetsialiseerunud arvutitehnoloogiale ja videomängudele. Seda seetõttu, et rohkem kui 5 aastat olen kirjutanud erinevatele tehnoloogia ja videomängude veebisaitidele, luues artikleid, mille eesmärk on anda teile vajalikku teavet kõigile arusaadavas keeles.
Kui teil on küsimusi, siis minu teadmised ulatuvad kõigest, mis on seotud nii Windowsi operatsioonisüsteemiga kui ka Androidiga mobiiltelefonidele. Ja ma olen pühendunud teile, olen alati nõus kulutama paar minutit ja aitama teil lahendada kõik küsimused, mis teil selles Interneti-maailmas tekkida võivad.