Claude Sonnet 4.5: Poboljšanja koda, agenta i sigurnosti

Postiže 61,4% rezultata na OSWorld testu i vodi na SWE-bench testu.
Obavlja složene zadatke više od 30 sati i generira do 64.000 tokena
Ažuriranja za Claude Code i novi Claude Agent SDK za agente
Poboljšana sigurnost (ASL-3) i ista cijena: 3/15 dolara po milion tokena

Slika modela Claude Sonnet 4.5

Anthropic je objavio Claude Sonnet 4.5, evoluciju usmjerenu na programiranje, agente i kontrolu računara koja nastoji konsolidirati platformu u profesionalnim okruženjima. U okruženju s visokorangiranim rivalima, kompanija opisuje ovo izdanje kao svoje... prefinjeniji i korisniji model za inženjerske zadatke do danas

Nova verzija se nadovezuje na dosadašnje rezultate porodice Sonnet, koja je već unaprijedila zaključivanje i kodiranje u prethodnim iteracijama. Nadograđujući se na tu osnovu, verzija 4.5 ima za cilj proširiti praktični opseg s napretkom u upornost pažnje, korištenje alata i produktivnost, održavajući razboritu strategiju u sigurnosti i usklađivanju.

Ključne mogućnosti i poboljšanja performansi

Generička slika Claudea Sonneta 4.5

Prema Anthropicu, Claude Sonnet 4.5 je sposoban održati koncentraciju više od 30 sati na složenim zadacima. i višestepeni, što favorizuje duge projekte gdje je potreban kontinuitet konteksta. Također podržava rezultate do 64.000 tokena u jednom odgovorui nudi kontrole za podešavanje „vremena razmišljanja“ prije odgovora, balansirajući brzinu i detalje prema potrebi.

Ekskluzivni sadržaj - kliknite ovdje Warner Music i Suno sklapaju pionirski savez za regulaciju muzike generirane umjetnom inteligencijom

U stvarnim zadacima ispred računara, Kompanija prijavljuje 61,4% u OSWorldu, što je značajan skok u odnosu na 42,2% njegovog prethodnika u istom testu.U praktičnim scenarijima, model može pregledajte web, popunite proračunske tablice i izvršite radnje u desktop aplikacijama iz Chrome ekstenzije, smanjujući kontinuirano praćenje korisnika.

Zemlja Programiranje koncentrira većinu poboljšanjaU SWE-bench Verified evaluaciji, koja se fokusirala na kodiranje primijenjeno na projekte iz stvarnog svijeta, Sonnet 4.5 prednjači sa 77,2% (s konfiguracijama koje povećavaju broj pri paralelnom računanju). Anthropic predlaže da model pokriva cijeli razvojni ciklus: planiranje, implementacija, refaktorisanje i održavanje velikih kodnih baza.

Iznad čistog razvoja, Antropski identificira upotrebe koje zahtijevaju produžene tokove i koordinaciju koraka.Od kibernetičke sigurnosti i finansija do produktivnosti u uredu i istraživanja korištenjem internih i eksternih podataka. U ovim kontekstima, obećanje leži u stabilnijim agentima sposobnim za održavanje dugoročnog rada bez gubitka konzistentnosti.

Alati i ekosistem za razvojne programere

Claudeov kod

Lansiranje dolazi u pratnji Šta je novo kod Claude Codea: kontrolne točke da sačuvate napredak i vratite se na prethodna stanja, kao što je istorija verzija, jedan obnovljeni terminalni interfejs, izvorno proširenje za Visual Studio Code i poboljšanja uređivanja konteksta i memorije putem API-ja za izvršavanje dužih zadataka.

Ekskluzivni sadržaj - kliknite ovdje AMD i Stability AI revolucioniraju lokalno AI renderiranje na laptopima uz Amuse 3.1

Anthropic također premijerno prikazuje SDK agenta Claudea, koja replicira infrastrukturu koju kompanija koristi za izgradnju vlastitih agenataKomplet nudi alate za dugoročno pamćenje, sisteme dozvola i koordinaciju podagenta, olakšavajući kreiranje automatizovanih rješenja koja sarađuju ka zajedničkim ciljevima i osiguravaju povezivanje sa alatima kao što su WireGuard.

kao dopuna, Firma privremeno omogućava program „Zamislite s Claudeom“, demonstracija koja nam omogućava da posmatramo kako model generira softver u realnom vremenu Nema unaprijed definiranog koda. Ovaj pregled, dostupan ograničeno vrijeme korisnicima Max verzije, ilustruje potencijal modela za interaktivno kreiranje.

Sigurnost, usklađenost i otpornost

Anthropic uključuje Sonnet 4.5 u svoj nivo zaštite Nivo sigurnosti umjetne inteligencije 3 (ASL-3), s filterima obučenim za otkrivanje opasnog sadržaja, posebno onog povezanog s CBRN rizicima. Kompanija tvrdi da je smanjila lažno pozitivnih rezultata za faktor deset u poređenju sa početnom verzijom ovih klasifikatora i nudi Kontinuitet razgovora sa Sonetom 4 u slučaju sigurnosnog zaključavanja.

Paralelno s tim, kompanija osigurava da Model smanjuje neželjena ponašanja poput laskanja ili obmanjujućih odgovora i jača odbranu od pokušaja brza injekcijaOve mjere ukazuju na upotrebu pouzdaniji u korporativnim okruženjima, gdje izvršavanje automatiziranih radnji zahtijeva kontrole i sljedivost.

Ekskluzivni sadržaj - kliknite ovdje Kako će interakcija čovjeka i računara izgledati u budućnosti?

Dostupnost, platforme i cijene

Slika Claudea Sonneta 4.5

Claude Sonnet 4.5 je dostupan na Claude.ai (web, iOS i Android) i za programere putem Claude Developer platforme, s integracijom u servise kao što su Amazon Bedrock i Google Cloud Vertex AI. Besplatni plan funkcionira s ograničenjem sesija koje se resetuje svakih pet sati i promjenjivim brojem poruka na zahtjev. Cijene ostaju iste.3 dolara po milionu ulaznih tokena i 15 dolara po milionu izlaznih tokena.

Među novim funkcijama pristupa, Claudeovo proširenje za Chrome postaje dostupno korisnicima Max verzije. prethodno registrovan na listi čekanja. Iako testovi ukazuju na značajna poboljšanja u poređenju s prethodnim iteracijama, Anthropic napominje da stvarne performanse zavise od slučaja upotrebe i budžeta za obrazloženje konfigurisanog za svaki zadatak.

Kombinacijom napretka u kodiranju, veće autonomije agenata i strožeg fokusa na sigurnost, Claude Sonnet 4.5 je pozicioniran kao solidna opcija za tehničke timove kojima je potreban kontinuitet i kontrola u dugotrajnim procesima, održavanje stabilnih troškova i kompatibilnosti s već uspostavljenim ekosistemom Anthropic-a.

LinkedIn podešavanje umjetne inteligencije

Vezani članak:

LinkedIn prilagođava svoju umjetnu inteligenciju: promjene privatnosti, regije i kako je onemogućiti

Alberto navarro

Ja sam tehnološki entuzijasta koji je svoja "geek" interesovanja pretvorio u profesiju. Proveo sam više od 10 godina svog života koristeći najsavremeniju tehnologiju i petljajući po svim vrstama programa iz čiste radoznalosti. Sada sam se specijalizirao za kompjutersku tehnologiju i video igrice. To je zato što više od 5 godina pišem za razne web stranice o tehnologiji i video igricama, stvarajući članke koji nastoje dati vam potrebne informacije na jeziku koji je svima razumljiv.

Ako imate bilo kakvih pitanja, moje znanje seže od svega vezanog za Windows operativni sistem kao i Android za mobilne telefone. I moja posvećenost je vama, uvijek sam spreman potrošiti nekoliko minuta i pomoći vam da riješite sva pitanja koja imate u ovom svijetu interneta.