Claude Sonnet 4.5: Skok u kodiranju, agentima i korištenju računara

Posljednje ažuriranje: 02/10/2025

  • Postiže 61,4% rezultata na OSWorld testu i vodi na SWE-bench testu.
  • Obavlja složene zadatke više od 30 sati i generira do 64.000 tokena
  • Ažuriranja za Claude Code i novi Claude Agent SDK za agente
  • Poboljšana sigurnost (ASL-3) i ista cijena: 3/15 dolara po milion tokena

Slika modela Claude Sonnet 4.5

Anthropic je objavio Claude Sonnet 4.5, evoluciju usmjerenu na programiranje, agente i kontrolu računara koja nastoji konsolidirati platformu u profesionalnim okruženjima. U okruženju s visokorangiranim rivalima, kompanija opisuje ovo izdanje kao svoje... prefinjeniji i korisniji model za inženjerske zadatke do danas

Nova verzija se nadovezuje na dosadašnje rezultate porodice Sonnet, koja je već unaprijedila zaključivanje i kodiranje u prethodnim iteracijama. Nadograđujući se na tu osnovu, verzija 4.5 ima za cilj proširiti praktični opseg s napretkom u upornost pažnje, korištenje alata i produktivnost, održavajući razboritu strategiju u sigurnosti i usklađivanju.

Ključne mogućnosti i poboljšanja performansi

Generička slika Claudea Sonneta 4.5

Prema Anthropicu, Claude Sonnet 4.5 je sposoban održati koncentraciju više od 30 sati na složenim zadacima. i višestepeni, što favorizuje duge projekte gdje je potreban kontinuitet konteksta. Također podržava rezultate do 64.000 tokena u jednom odgovorui nudi kontrole za podešavanje „vremena razmišljanja“ prije odgovora, balansirajući brzinu i detalje prema potrebi.

Ekskluzivni sadržaj - kliknite ovdje  YouTube pooštrava svoju politiku protiv masovno produciranih videa i videa zasnovanih na vještačkoj inteligenciji

U stvarnim zadacima ispred računara, Kompanija prijavljuje 61,4% u OSWorldu, što je značajan skok u odnosu na 42,2% njegovog prethodnika u istom testu.U praktičnim scenarijima, model može pregledajte web, popunite proračunske tablice i izvršite radnje u desktop aplikacijama iz Chrome ekstenzije, smanjujući kontinuirano praćenje korisnika.

Zemlja Programiranje koncentrira većinu poboljšanjaU SWE-bench Verified evaluaciji, koja se fokusirala na kodiranje primijenjeno na projekte iz stvarnog svijeta, Sonnet 4.5 prednjači sa 77,2% (s konfiguracijama koje povećavaju broj pri paralelnom računanju). Anthropic predlaže da model pokriva cijeli razvojni ciklus: planiranje, implementacija, refaktorisanje i održavanje velikih kodnih baza.

Iznad čistog razvoja, Antropski identificira upotrebe koje zahtijevaju produžene tokove i koordinaciju koraka.Od kibernetičke sigurnosti i finansija do produktivnosti u uredu i istraživanja korištenjem internih i eksternih podataka. U ovim kontekstima, obećanje leži u stabilnijim agentima sposobnim za održavanje dugoročnog rada bez gubitka konzistentnosti.

Alati i ekosistem za razvojne programere

Claudeov kod

Lansiranje dolazi u pratnji Šta je novo kod Claude Codea: kontrolne točke da sačuvate napredak i vratite se na prethodna stanja, kao što je istorija verzija, jedan obnovljeni terminalni interfejs, izvorno proširenje za Visual Studio Code i poboljšanja uređivanja konteksta i memorije putem API-ja za izvršavanje dužih zadataka.

Ekskluzivni sadržaj - kliknite ovdje  Anthropic i slučaj umjetne inteligencije koja je preporučila pijenje izbjeljivača: kada modeli varaju

Anthropic također premijerno prikazuje SDK agenta Claudea, koja replicira infrastrukturu koju kompanija koristi za izgradnju vlastitih agenataKomplet nudi alate za dugoročno pamćenje, sisteme dozvola i koordinaciju podagenta, olakšavajući kreiranje automatizovanih rješenja koja sarađuju ka zajedničkim ciljevima i osiguravaju povezivanje sa alatima kao što su WireGuard.

kao dopuna, Firma privremeno omogućava program „Zamislite s Claudeom“, demonstracija koja nam omogućava da posmatramo kako model generira softver u realnom vremenu Nema unaprijed definiranog koda. Ovaj pregled, dostupan ograničeno vrijeme korisnicima Max verzije, ilustruje potencijal modela za interaktivno kreiranje.

Sigurnost, usklađenost i otpornost

Anthropic uključuje Sonnet 4.5 u svoj nivo zaštite Nivo sigurnosti umjetne inteligencije 3 (ASL-3), s filterima obučenim za otkrivanje opasnog sadržaja, posebno onog povezanog s CBRN rizicima. Kompanija tvrdi da je smanjila lažno pozitivnih rezultata za faktor deset u poređenju sa početnom verzijom ovih klasifikatora i nudi Kontinuitet razgovora sa Sonetom 4 u slučaju sigurnosnog zaključavanja.

Paralelno s tim, kompanija osigurava da Model smanjuje neželjena ponašanja poput laskanja ili obmanjujućih odgovora i jača odbranu od pokušaja brza injekcijaOve mjere ukazuju na upotrebu pouzdaniji u korporativnim okruženjima, gdje izvršavanje automatiziranih radnji zahtijeva kontrole i sljedivost.

Ekskluzivni sadržaj - kliknite ovdje  Gemini AI sada može pronaći pjesme poput Shazam-a na vašem mobilnom telefonu

Dostupnost, platforme i cijene

Slika Claudea Sonneta 4.5

Claude Sonnet 4.5 je dostupan na Claude.ai (web, iOS i Android) i za programere putem Claude Developer platforme, s integracijom u servise kao što su Amazon Bedrock i Google Cloud Vertex AI. Besplatni plan funkcionira s ograničenjem sesija koje se resetuje svakih pet sati i promjenjivim brojem poruka na zahtjev. Cijene ostaju iste.3 dolara po milionu ulaznih tokena i 15 dolara po milionu izlaznih tokena.

Među novim funkcijama pristupa, Claudeovo proširenje za Chrome postaje dostupno korisnicima Max verzije. prethodno registrovan na listi čekanja. Iako testovi ukazuju na značajna poboljšanja u poređenju s prethodnim iteracijama, Anthropic napominje da stvarne performanse zavise od slučaja upotrebe i budžeta za obrazloženje konfigurisanog za svaki zadatak.

Kombinacijom napretka u kodiranju, veće autonomije agenata i strožeg fokusa na sigurnost, Claude Sonnet 4.5 je pozicioniran kao solidna opcija za tehničke timove kojima je potreban kontinuitet i kontrola u dugotrajnim procesima, održavanje stabilnih troškova i kompatibilnosti s već uspostavljenim ekosistemom Anthropic-a.

LinkedIn podešavanje umjetne inteligencije
Vezani članak:
LinkedIn prilagođava svoju umjetnu inteligenciju: promjene privatnosti, regije i kako je onemogućiti