- Postiže 61,4% rezultata na OSWorld testu i vodi na SWE-bench testu.
- Obavlja složene zadatke više od 30 sati i generira do 64.000 tokena
- Ažuriranja za Claude Code i novi Claude Agent SDK za agente
- Poboljšana sigurnost (ASL-3) i ista cijena: 3/15 dolara po milion tokena

Anthropic je objavio Claude Sonnet 4.5, evoluciju usmjerenu na programiranje, agente i kontrolu računara koja nastoji konsolidirati platformu u profesionalnim okruženjima. U okruženju s visokorangiranim rivalima, kompanija opisuje ovo izdanje kao svoje... prefinjeniji i korisniji model za inženjerske zadatke do danas
Nova verzija se nadovezuje na dosadašnje rezultate porodice Sonnet, koja je već unaprijedila zaključivanje i kodiranje u prethodnim iteracijama. Nadograđujući se na tu osnovu, verzija 4.5 ima za cilj proširiti praktični opseg s napretkom u upornost pažnje, korištenje alata i produktivnost, održavajući razboritu strategiju u sigurnosti i usklađivanju.
Ključne mogućnosti i poboljšanja performansi

Prema Anthropicu, Claude Sonnet 4.5 je sposoban održati koncentraciju više od 30 sati na složenim zadacima. i višestepeni, što favorizuje duge projekte gdje je potreban kontinuitet konteksta. Također podržava rezultate do 64.000 tokena u jednom odgovorui nudi kontrole za podešavanje „vremena razmišljanja“ prije odgovora, balansirajući brzinu i detalje prema potrebi.
U stvarnim zadacima ispred računara, Kompanija prijavljuje 61,4% u OSWorldu, što je značajan skok u odnosu na 42,2% njegovog prethodnika u istom testu.U praktičnim scenarijima, model može pregledajte web, popunite proračunske tablice i izvršite radnje u desktop aplikacijama iz Chrome ekstenzije, smanjujući kontinuirano praćenje korisnika.
Zemlja Programiranje koncentrira većinu poboljšanjaU SWE-bench Verified evaluaciji, koja se fokusirala na kodiranje primijenjeno na projekte iz stvarnog svijeta, Sonnet 4.5 prednjači sa 77,2% (s konfiguracijama koje povećavaju broj pri paralelnom računanju). Anthropic predlaže da model pokriva cijeli razvojni ciklus: planiranje, implementacija, refaktorisanje i održavanje velikih kodnih baza.
Iznad čistog razvoja, Antropski identificira upotrebe koje zahtijevaju produžene tokove i koordinaciju koraka.Od kibernetičke sigurnosti i finansija do produktivnosti u uredu i istraživanja korištenjem internih i eksternih podataka. U ovim kontekstima, obećanje leži u stabilnijim agentima sposobnim za održavanje dugoročnog rada bez gubitka konzistentnosti.
Alati i ekosistem za razvojne programere

Lansiranje dolazi u pratnji Šta je novo kod Claude Codea: kontrolne točke da sačuvate napredak i vratite se na prethodna stanja, kao što je istorija verzija, jedan obnovljeni terminalni interfejs, izvorno proširenje za Visual Studio Code i poboljšanja uređivanja konteksta i memorije putem API-ja za izvršavanje dužih zadataka.
Anthropic također premijerno prikazuje SDK agenta Claudea, koja replicira infrastrukturu koju kompanija koristi za izgradnju vlastitih agenataKomplet nudi alate za dugoročno pamćenje, sisteme dozvola i koordinaciju podagenta, olakšavajući kreiranje automatizovanih rješenja koja sarađuju ka zajedničkim ciljevima i osiguravaju povezivanje sa alatima kao što su WireGuard.
kao dopuna, Firma privremeno omogućava program „Zamislite s Claudeom“, demonstracija koja nam omogućava da posmatramo kako model generira softver u realnom vremenu Nema unaprijed definiranog koda. Ovaj pregled, dostupan ograničeno vrijeme korisnicima Max verzije, ilustruje potencijal modela za interaktivno kreiranje.
Sigurnost, usklađenost i otpornost
Anthropic uključuje Sonnet 4.5 u svoj nivo zaštite Nivo sigurnosti umjetne inteligencije 3 (ASL-3), s filterima obučenim za otkrivanje opasnog sadržaja, posebno onog povezanog s CBRN rizicima. Kompanija tvrdi da je smanjila lažno pozitivnih rezultata za faktor deset u poređenju sa početnom verzijom ovih klasifikatora i nudi Kontinuitet razgovora sa Sonetom 4 u slučaju sigurnosnog zaključavanja.
Paralelno s tim, kompanija osigurava da Model smanjuje neželjena ponašanja poput laskanja ili obmanjujućih odgovora i jača odbranu od pokušaja brza injekcijaOve mjere ukazuju na upotrebu pouzdaniji u korporativnim okruženjima, gdje izvršavanje automatiziranih radnji zahtijeva kontrole i sljedivost.
Dostupnost, platforme i cijene

Claude Sonnet 4.5 je dostupan na Claude.ai (web, iOS i Android) i za programere putem Claude Developer platforme, s integracijom u servise kao što su Amazon Bedrock i Google Cloud Vertex AI. Besplatni plan funkcionira s ograničenjem sesija koje se resetuje svakih pet sati i promjenjivim brojem poruka na zahtjev. Cijene ostaju iste.3 dolara po milionu ulaznih tokena i 15 dolara po milionu izlaznih tokena.
Među novim funkcijama pristupa, Claudeovo proširenje za Chrome postaje dostupno korisnicima Max verzije. prethodno registrovan na listi čekanja. Iako testovi ukazuju na značajna poboljšanja u poređenju s prethodnim iteracijama, Anthropic napominje da stvarne performanse zavise od slučaja upotrebe i budžeta za obrazloženje konfigurisanog za svaki zadatak.
Kombinacijom napretka u kodiranju, veće autonomije agenata i strožeg fokusa na sigurnost, Claude Sonnet 4.5 je pozicioniran kao solidna opcija za tehničke timove kojima je potreban kontinuitet i kontrola u dugotrajnim procesima, održavanje stabilnih troškova i kompatibilnosti s već uspostavljenim ekosistemom Anthropic-a.
Ja sam tehnološki entuzijasta koji je svoja "geek" interesovanja pretvorio u profesiju. Proveo sam više od 10 godina svog života koristeći najsavremeniju tehnologiju i petljajući po svim vrstama programa iz čiste radoznalosti. Sada sam se specijalizirao za kompjutersku tehnologiju i video igrice. To je zato što više od 5 godina pišem za razne web stranice o tehnologiji i video igricama, stvarajući članke koji nastoje dati vam potrebne informacije na jeziku koji je svima razumljiv.
Ako imate bilo kakvih pitanja, moje znanje seže od svega vezanog za Windows operativni sistem kao i Android za mobilne telefone. I moja posvećenost je vama, uvijek sam spreman potrošiti nekoliko minuta i pomoći vam da riješite sva pitanja koja imate u ovom svijetu interneta.