- Se suoriutuu 61,4 % OSWorldissa ja johtaa SWE-bench Verified -verifikaatiossa.
- Käsittelee monimutkaisia tehtäviä yli 30 tunnin ajan ja tuottaa jopa 64 000 tokenia
- Päivityksiä Claude-koodiin ja uuteen Claude Agent SDK:hon agenteille
- Parannettu turvallisuus (ASL-3) ja sama hinta: 3/15 dollaria miljoonaa tokenia kohden
Anthropic on julkaissut Claude Sonnet 4.5:n, ohjelmointiin, agentteihin ja tietokoneohjaukseen keskittyvän kehitysaskeleen, jonka tavoitteena on vakiinnuttaa alusta ammattimaisiin ympäristöihin. Yritys kuvailee tätä julkaisua sen... hienostuneempi ja hyödyllisempi malli suunnittelutehtäviin tähän mennessä
Uusi versio pohjautuu Sonnet-perheen saavutuksiin, jotka olivat jo parantaneet päättelyä ja koodausta aiemmissa iteraatioissa. Tämän pohjalta versio 4.5 pyrkii laajentamaan käytännön laajuutta parantamalla keskittymiskyky, työkalujen käyttö ja tuottavuus, ylläpitämällä harkittua strategiaa turvallisuuden ja yhdenmukaisuuden suhteen.
Keskeiset ominaisuudet ja suorituskyvyn parannukset

Antrooppisen teorian mukaan, Claude Sonnet 4.5 pystyy ylläpitämään keskittymistä yli 30 tuntia monimutkaisissa tehtävissä. ja monivaiheinen, mikä suosii pitkiä projekteja, joissa kontekstin jatkuvuus on tärkeää. Se tukee myös jopa 64 000 tokenia yhdessä vastauksessaja tarjoaa säätimiä "ajatusajan" säätämiseen ennen vastaamista tasapainottaen nopeutta ja yksityiskohtia tarpeen mukaan.
Todellisissa tehtävissä tietokoneen ääressä, Yhtiö raportoi OSWorldissa 61,4 %:n tuloksen, mikä on huomattava harppaus edeltäjänsä 42,2 %:iin verrattuna samassa testissä.Käytännön tilanteissa malli voi selata verkkoa, täyttää laskentataulukoita ja suorittaa toimintoja Chrome-laajennuksen työpöytäsovelluksissa, mikä vähentää jatkuvaa käyttäjien valvontaa.
Maa Ohjelmointi keskittyy suurimpaan osaan parannuksistaSWE-bench Verified -arvioinnissa, jossa keskityttiin tosielämän projekteissa sovellettuun koodaukseen, Sonnet 4.5 johtaa tietä 77,2 prosentilla. (kokoonpanoilla, jotka lisäävät määrää rinnakkaislaskennassa). Anthropic ehdottaa, että malli kattaa koko kehityssyklin: suurten koodikantojen suunnittelu, toteutus, uudelleenjärjestely ja ylläpito.
Puhtaan kehityksen tuolla puolen, Antrooppinen tunnistaa käyttötarkoitukset, jotka vaativat pitkittyneitä prosesseja ja vaiheiden koordinointia.Kyberturvallisuudesta ja rahoituksesta toimistojen tuottavuuteen ja sisäisen ja ulkoisen datan käyttöön perustuvaan tutkimukseen. Näissä yhteyksissä lupaus piilee vakaammissa agenteissa, jotka pystyvät ylläpitämään pitkäaikaista työtä menettämättä johdonmukaisuutta.
Kehittäjätyökalut ja ekosysteemi

Lanseerauksen mukana tulee Mitä uutta Claude Codella on?: tarkistuspisteet tallentaaksesi edistymisen ja palataksesi edellisiin tiloihin, kuten version historia, One uudistettu terminaalikäyttöliittymä, natiivilaajennus Visual Studio Codelle ja parannuksia kontekstin ja muistin muokkaamiseen API:n kautta pidempien tehtävien suorittamiseksi.
Anthropic esittää myös Claude Agent SDK, joka kopioi infrastruktuurin, jota yritys käyttää omien agenttiensa rakentamiseenPakkaus tarjoaa työkaluja pitkäkestoiseen muistiin, lupajärjestelmiin ja aliagenttien koordinointiin, mikä helpottaa automatisoitujen ratkaisujen luomista, jotka tekevät yhteistyötä yhteisten tavoitteiden saavuttamiseksi ja turvallisen yhteyden muodostamiseksi työkalujen, kuten WireGuard.
Täydennyksenä, Yritys ottaa väliaikaisesti käyttöön ”Imagine with Claude” -palvelun., demonstraatio, jonka avulla voimme havaita, miten malli luo ohjelmistoja reaaliajassa Ei ennalta määriteltyä koodia. Tämä esikatselu, joka on saatavilla rajoitetun ajan Max-käyttäjille, havainnollistaa mallin potentiaalia interaktiiviseen luomiseen.
Turvallisuus, yhdenmukaisuus ja kestävyys
Anthropic sisältää Sonnet 4.5:n suojaustasolla Tekoälyn turvallisuustaso 3 (ASL-3), suodattimilla, jotka on koulutettu havaitsemaan vaarallista sisältöä, erityisesti CBRN-riskeihin liittyvää sisältöä. Yritys väittää vähentäneensä vääriä positiivisia kymmenkertaisesti verrattuna näiden luokittelijoiden alkuperäiseen versioon ja tarjoaa Keskustelun jatkuvuus Sonnet 4:n kanssa, jos tapahtuu turvalukitus.
Samalla yhtiö varmistaa, että Malli vähentää ei-toivottua käyttäytymistä, kuten imartelua tai petollisia reaktioita, ja vahvistaa puolustusta yrityksiä vastaan. nopea injektioNämä toimenpiteet viittaavat käyttöön luotettavampi yritysympäristöissä, jossa automatisoitujen toimintojen suorittaminen edellyttää valvontaa ja jäljitettävyyttä.
Saatavuus, alustat ja hinnat

Claude Sonnet 4.5 on saatavilla Claude.ai:sta (verkko, iOS ja Android) ja kehittäjille Claude-kehittäjäalustan kautta, integroinnilla palveluihin, kuten Amazon Bedrock ja Google Cloud Vertex AI. Ilmaisversiossa on istuntorajoitus, joka nollautuu viiden tunnin välein, ja viestien määrä voi vaihdella tarvittaessa. Hinnat pysyvät samoina.3 dollaria miljoonaa syöttötokenia kohden ja 15 dollaria miljoonaa tulostokenia kohden.
Uusien käyttöoikeusominaisuuksien joukossa Clauden Chrome-laajennus on tulossa Max-käyttäjille. aiemmin odotuslistalla olleita. Vaikka vertailuarvot viittaavat huomattaviin parannuksiin aiempiin iteraatioihin verrattuna, Anthropic huomauttaa, että todellinen suorituskyky riippuu käyttötapauksesta ja kullekin tehtävälle määritetystä päättelybudjetista.
Koodauksen edistymisen, agenttien suuremman autonomian ja tiukemman tietoturvapainotteisuuden yhdistelmällä Claude Sonnet 4.5 on vakuuttava vaihtoehto teknisille tiimeille, jotka tarvitsevat jatkuvuutta ja hallintaa pitkissä prosesseissa, vakaat kustannukset ja yhteensopivuus Anthropicin jo käyttöönotetun ekosysteemin kanssa.
Olen teknologian harrastaja, joka on muuttanut "nörtti"-harrastuksensa ammatiksi. Olen käyttänyt yli 10 vuotta elämästäni uusinta teknologiaa käyttäen ja kaikenlaisten ohjelmien parissa puhtaasta uteliaisuudesta. Nyt olen erikoistunut tietotekniikkaan ja videopeleihin. Tämä johtuu siitä, että yli 5 vuoden ajan olen työskennellyt kirjoittaen useille teknologiaa ja videopelejä käsitteleville verkkosivustoille ja luonut artikkeleita, jotka pyrkivät antamaan sinulle tarvitsemaasi tietoa kielellä, jota kaikki ymmärtävät.
Jos sinulla on kysyttävää, tietoni ulottuu kaikesta Windows-käyttöjärjestelmään liittyvästä sekä matkapuhelimien Androidista. Ja sitoumukseni on sinulle, olen aina valmis käyttämään muutaman minuutin ja auttamaan sinua ratkaisemaan kaikki kysymyksesi, joita sinulla saattaa olla tässä Internet-maailmassa.