Claude Sonnet 4.5: Hüpe kodeerimises, agentides ja arvutikasutuses

Viimane uuendus: 02/10/2025

  • OSWorldi edetabelis on selle tulemus 61,4% ja see on SWE-bench Verifiedi edetabelis esikohal.
  • Täidab keerulisi ülesandeid enam kui 30 tunni jooksul ja genereerib kuni 64 000 žetooni
  • Claude'i koodi ja uue Claude'i agendi SDK värskendused agentidele
  • Täiustatud turvalisus (ASL-3) ja sama hind: 3/15 dollarit miljoni žetooni kohta

Claude Sonnet 4.5 mudeli pilt

Anthropic on välja andnud Claude Sonnet 4.5, mis on programmeerimisele, agentidele ja arvutijuhtimisele keskendunud evolutsiooniversioon, mille eesmärk on platvormi konsolideerimine professionaalses keskkonnas. Maastikus, kus on kõrgetasemelisi konkurente, kirjeldab ettevõte seda versiooni kui oma... rafineeritum ja kasulikum mudel inseneriülesannete jaoks siiani.

Uus versioon tugineb Sonneti perekonna varasematele tulemustele, mis olid juba varasemates versioonides parandanud arutluskäiku ja kodeerimist. Sellele alusele tuginedes on versiooni 4.5 eesmärk laiendada praktilist ulatust edusammudega järgmistes valdkondades: tähelepanu püsivus, tööriistade kasutamine ja tootlikkus, säilitades turvalisuse ja ühtlustamise osas ettevaatliku strateegia.

Peamised võimalused ja jõudluse täiustused

Claude Sonnet 4.5 üldine pilt

Antroopilise teooria kohaselt Claude Sonnet 4.5 suudab keeruliste ülesannete puhul keskenduda enam kui 30 tundi. ja mitmeastmeline, mis soosib pikki projekte, kus konteksti järjepidevus on vajalik. See toetab ka kuni 64 000 žetooni ühes vastusesning pakub juhtnuppe vastamisele eelneva „mõtlemisaja” reguleerimiseks, tasakaalustades vastavalt vajadusele kiirust ja detaile.

Eksklusiivne sisu – klõpsake siin  YouTube karmistab oma poliitikat masstoodangu ja tehisintellektiga videote vastu

Päris ülesannete täitmisel arvuti ees, Ettevõte teatab OSWorldis 61,4%-st, mis on märkimisväärne hüpe võrreldes eelkäija 42,2%-ga samas testis.Praktilistes olukordades saab mudel sirvida veebi, täita arvutustabeleid ja teha toiminguid Chrome'i laienduse töölauarakendustes, vähendades pidevat kasutajate jälgimist.

Maa Programmeerimine koondab suurema osa täiustustestSWE-bench Verified hindamises, mis keskendus reaalsetes projektides rakendatud kodeerimisele, Sonnet 4.5 on 77,2%-ga eesotsas. (konfiguratsioonidega, mis suurendavad arvu paralleelarvutuse korral). Antroopiline pakub välja, et mudel hõlmab kogu arendustsüklit: suurte koodibaaside planeerimine, rakendamine, refaktoreerimine ja hooldus.

Lisaks puhtale arengule, Antroopiline määratleb kasutusviisid, mis nõuavad pikaajalisi vooge ja sammude koordineerimist.Alates küberturvalisusest ja rahandusest kuni kontoritöö tootlikkuse ja sise- ja välisandmeid kasutavate uuringuteni. Nendes kontekstides peitub potentsiaali stabiilsemates agentides, mis suudavad pikaajalist tööd järjepidevust kaotamata teha.

Arendaja tööriistad ja ökosüsteem

Claude'i kood

Käivitusega kaasneb Mis on Claude Code'is uut?: kontrollpunktid edenemise salvestamiseks ja eelmistesse olekutesse naasmiseks, näiteks versiooni ajalugu, Üks uuendatud terminaliliides, Visual Studio koodi natiivne laiendus ja konteksti ja mälu redigeerimise täiustused API kaudu pikemate ülesannete käitamiseks.

Eksklusiivne sisu – klõpsake siin  Antroopiline ja tehisintellekti juhtum, mis soovitas valgendi joomist: kui mudelid petavad

Antroopilises esilinastusel on ka Claude'i agendi SDK, mis kopeerib infrastruktuuri, mida ettevõte kasutab oma agentide loomiseksKomplekt pakub tööriistu pikaajaliseks mäluks, lubade süsteemideks ja subagentide koordineerimiseks, hõlbustades automatiseeritud lahenduste loomist, mis teevad koostööd ühiste eesmärkide saavutamiseks ja turvalise ühenduvuse tagamiseks selliste tööriistadega nagu WireGuard.

Täiendusena Firma võimaldab ajutiselt funktsiooni „Imagine with Claude”, demonstratsioon, mis võimaldab meil jälgida, kuidas mudel genereerib tarkvara reaalajas Eelmääratletud koodi pole. See eelvaade, mis on piiratud aja jooksul saadaval Maxi kasutajatele, illustreerib mudeli interaktiivse loomise potentsiaali.

Turvalisus, kooskõla ja vastupidavus

Anthropic sisaldab oma kaitsetasemes Sonnet 4.5 Tehisintellekti ohutustase 3 (ASL-3), filtritega, mis on treenitud tuvastama ohtlikku sisu, eriti CBRN-riskidega seotud sisu. Ettevõte väidab, et on vähendanud valepositiivseid kümnekordselt võrreldes nende klassifikaatorite algversiooniga ja pakub Vestluse jätkumine Sonnet 4-ga turvalukustuse korral.

Samal ajal tagab ettevõte, et Mudel vähendab soovimatut käitumist, nagu meelitused või petlikud reaktsioonid, ja tugevdab kaitset katsete vastu. kiire süstimineNeed meetmed viitavad kasutamisele usaldusväärsem ettevõttekeskkonnas, kus automatiseeritud toimingute teostamine nõuab kontrolli ja jälgitavust.

Eksklusiivne sisu – klõpsake siin  Gemini tehisintellekt leiab nüüd teie mobiiltelefonist selliseid laule nagu Shazam

Saadavus, platvormid ja hinnad

Pilt Claude Sonnetilt 4.5

Claude Sonnet 4.5 on saadaval Claude.ai-s (veeb, iOS ja Android) ja arendajatele Claude'i arendajaplatvormi kaudu, integreerides selle selliste teenustega nagu Amazon Bedrock ja Google Cloud Vertex AI. Tasuta pakett töötab seansi limiidiga, mis lähtestatakse iga viie tunni järel, ja muutuva arvu sõnumitega vastavalt nõudmisele. Hinnad jäävad samaks.3 dollarit miljoni sisendtokeni ja 15 dollarit miljoni väljundtokeni kohta.

Uute juurdepääsufunktsioonide hulgas on Claude'i Chrome'i laiendust hakatakse tegema Maxi kasutajatele. varem ootenimekirjas registreeritud. Kuigi võrdlusnäitajad viitavad varasemate iteratsioonidega võrreldes märkimisväärsele paranemisele, märgib Anthropic, et tegelik jõudlus sõltub kasutusjuhtumist ja iga ülesande jaoks konfigureeritud arutluskäigu eelarvest.

Kodeerimise edusammude, agentide suurema autonoomia ja rangema turvalisusele keskendumise kombinatsiooniga Claude Sonnet 4.5 on positsioneeritud kindla valikuna tehnilistele meeskondadele, kes vajavad pikkade protsesside käigus järjepidevust ja kontrolli, stabiilsete kulude ja ühilduvuse säilitamine Anthropici juba kasutusele võetud ökosüsteemiga.

LinkedIni kohandamise tehisintellekt
Seotud artikkel:
LinkedIn kohandab oma tehisintellekti: privaatsusmuudatused, piirkonnad ja kuidas see keelata