Claude Sonnet 4.5: Lēciens kodēšanā, aģentos un datoru lietošanā

Pēdējā atjaunošana: 02/10/2025

  • Tas OSWorld indeksā sasniedz 61,4 % un ir vadošais SWE-bench Verified indeksā.
  • Veic sarežģītus uzdevumus vairāk nekā 30 stundas un ģenerē līdz pat 64 000 žetonu
  • Claude Code un jaunā Claude Agent SDK aģentiem atjauninājumi
  • Paaugstināta drošība (ASL-3) un tā pati cena: 3/15 USD par miljonu žetonu

Claude Sonnet 4.5 modeļa attēls

Uzņēmums Anthropic ir izlaidis Claude Sonnet 4.5 — evolūcijas versiju, kas koncentrējas uz programmēšanu, aģentiem un datoru vadību un kuras mērķis ir nostiprināt platformu profesionālā vidē. Augsta līmeņa konkurentu vidē uzņēmums šo versiju raksturo kā savu… izsmalcinātāks un noderīgāks modelis inženiertehniskiem uzdevumiem Līdz šim

Jaunā versija balstās uz Sonnet saimes sasniegumiem, kas iepriekšējās iterācijās jau bija uzlabojuši spriešanas spējas un kodēšanu. Balstoties uz šo pamatu, 4.5 mērķis ir paplašināt praktisko darbības jomu ar uzlabojumiem uzmanības noturība, instrumentu lietošana un produktivitāte, saglabājot pārdomātu drošības un saskaņošanas stratēģiju.

Galvenās iespējas un veiktspējas uzlabojumi

Kloda Soneta 4.5 vispārīgs attēls

Saskaņā ar Antropu, Claude Sonnet 4.5 spēj saglabāt koncentrēšanos vairāk nekā 30 stundas sarežģītu uzdevumu veikšanā. un daudzpakāpju, kas dod priekšroku gariem projektiem, kuros nepieciešama konteksta nepārtrauktība. Tas atbalsta arī rezultātus līdz pat 64 000 žetonu vienā atbildē, un piedāvā vadības ierīces, lai pielāgotu “domāšanas laiku” pirms atbildes sniegšanas, pēc nepieciešamības līdzsvarojot ātrumu un detaļas.

Ekskluzīvs saturs — noklikšķiniet šeit  YouTube pastiprina savu politiku pret masveidā ražotiem un ar mākslīgo intelektu darbinātiem video

Reālos uzdevumos pie datora, Uzņēmums ziņo par 61,4% OSWorld testā, kas ir ievērojams lēciens salīdzinājumā ar tā priekšgājēja 42,2% šajā pašā testā.Praktiskos gadījumos modelis var pārlūkot tīmekli, aizpildīt izklājlapas un veikt darbības darbvirsmas lietojumprogrammās no Chrome paplašinājuma, samazinot nepārtrauktu lietotāju uzraudzību.

Zeme Programmēšana koncentrējas uz lielāko daļu uzlabojumuSWE-bench Verified novērtējumā, kas bija vērsts uz kodēšanas piemērošanu reālos projektos, Sonnet 4.5 ir līderis ar 77,2 % (ar konfigurācijām, kas palielina skaitu paralēlās skaitļošanas apstākļos). Antropic ierosina, ka modelim jāaptver viss izstrādes cikls: lielu koda bāzu plānošana, ieviešana, refaktorēšana un uzturēšana.

Vairāk nekā tīra attīstība, Antropoze identificē lietojumus, kuriem nepieciešamas ilgstošas ​​plūsmas un soļu koordinācija.No kiberdrošības un finanšu līdz biroja produktivitātei un pētniecībai, izmantojot iekšējos un ārējos datus. Šādos kontekstos daudzsološs ir stabilāks aģents, kas spēj uzturēt ilgtermiņa darbu, nezaudējot konsekvenci.

Izstrādātāju rīki un ekosistēma

Klods Kods

Palaišanu pavada Kas jauns Claude Code veikalā?: kontrolpunkti lai saglabātu progresu un atgrieztos iepriekšējos stāvokļos, piemēram, versiju vēsture, Viena uzlabota termināļa saskarne, Visual Studio koda vietējais paplašinājums un uzlabojumi konteksta un atmiņas rediģēšanā, izmantojot API, lai palaistu ilgākus uzdevumus.

Ekskluzīvs saturs — noklikšķiniet šeit  Antropoze un mākslīgā intelekta gadījums, kas ieteica dzert balinātāju: kad modeļi krāpjas

Antropoiskajā filmā pirmizrāde notiek arī Claude aģenta SDK, kas atkārto infrastruktūru, ko uzņēmums izmanto savu aģentu izveideiKomplekts piedāvā rīkus ilgtermiņa atmiņai, atļauju sistēmām un apakšaģentu koordinācijai, veicinot automatizētu risinājumu izveidi, kas sadarbojas kopīgu mērķu sasniegšanai un nodrošina drošu savienojamību ar tādiem rīkiem kā WireGuard.

Kā papildinājums, Uzņēmums īslaicīgi iespējo funkciju “Iztēlojieties ar Klodu”, demonstrācija, kas ļauj mums novērot, kā modelis ģenerē programmatūru reāllaikā Nav iepriekš definēta koda. Šis priekšskatījums, kas ierobežotu laiku ir pieejams Max lietotājiem, ilustrē modeļa potenciālu interaktīvai izveidei.

Drošība, saskaņošana un noturība

Anthropic savā aizsardzības līmenī ietver Sonnet 4.5 AI drošības līmenis 3 (ASL-3), ar filtriem, kas apmācīti bīstama satura noteikšanai, jo īpaši tāda, kas saistīts ar CBRN riskiem. Uzņēmums apgalvo, ka ir samazinājis viltus pozitīvi desmit reizes salīdzinājumā ar šo klasifikatoru sākotnējo versiju un piedāvā Sarunas nepārtrauktība ar Sonnet 4 drošības bloķēšanas gadījumā.

Paralēli uzņēmums nodrošina, ka Modelis samazina nevēlamu uzvedību, piemēram, glaimus vai maldinošas reakcijas, un stiprina aizsardzību pret mēģinājumiem tūlītēja injekcijaŠie pasākumi ir paredzēti, lai izmantotu uzticamāka korporatīvajā vidē, kur automatizētu darbību izpildei ir nepieciešama kontrole un izsekojamība.

Ekskluzīvs saturs — noklikšķiniet šeit  Gemini mākslīgais intelekts tagad var atrast dziesmas, piemēram, Shazam, no jūsu mobilā tālruņa

Pieejamība, platformas un cenas

Attēls, autors Klods Sonnets 4.5

Claude Sonnet 4.5 ir pieejams vietnē Claude.ai (tīmeklī, iOS un Android) un izstrādātājiem, izmantojot Claude izstrādātāju platformu, integrējot to tādos pakalpojumos kā Amazon Bedrock un Google Cloud Vertex AI. Bezmaksas plāns darbojas ar sesijas ierobežojumu, kas tiek atiestatīts ik pēc piecām stundām, un mainīgu ziņojumu skaitu pēc pieprasījuma. Cenas paliek nemainīgas.3 ASV dolāri par miljonu ievades žetonu un 15 ASV dolāri par miljonu izvades žetonu.

Starp jaunajām piekļuves funkcijām, Kloda Chrome paplašinājums tiek ieviests Max lietotājiem. iepriekš reģistrēts gaidīšanas sarakstā. Lai gan salīdzinošie rādītāji liecina par ievērojamiem uzlabojumiem salīdzinājumā ar iepriekšējām iterācijām, Anthropic norāda, ka faktiskā veiktspēja ir atkarīga no lietošanas gadījuma un katram uzdevumam konfigurētā spriešanas budžeta.

Apvienojot sasniegumus kodēšanā, lielāku aģentu autonomiju un stingrāku uzmanību drošībai, Claude Sonnet 4.5 ir pozicionēts kā stabila iespēja tehniskajām komandām, kurām nepieciešama nepārtrauktība un kontrole garos procesos, saglabājot stabilas izmaksas un saderību ar Anthropic jau ieviesto ekosistēmu.

LinkedIn pielāgošanas mākslīgais intelekts
saistīto rakstu:
LinkedIn pielāgo savu mākslīgo intelektu: privātuma izmaiņas, reģioni un to atspējošana