- V testu OSWorld dosahuje 61,4 % výsledků a v testu SWE-bench Verified vede.
- Zvládá složité úkoly více než 30 hodin a generuje až 64 000 tokenů
- Aktualizace Claude Code a nové sady SDK Claude Agent pro agenty
- Zvýšené zabezpečení (ASL-3) a stejná cena: 3/15 dolarů za milion tokenů
Společnost Anthropic vydala Claude Sonnet 4.5, evolučního vývoje zaměřeného na programování, agenty a ovládání počítačů, jehož cílem je konsolidovat platformu v profesionálním prostředí. V prostředí s vysokou konkurencí společnost popisuje toto vydání jako své... propracovanější a užitečnější model pro inženýrské úkoly k dnešnímu dni.
Nová verze staví na historii rodiny Sonnet, která již v předchozích verzích zlepšila uvažování a kódování. Na tomto základě si verze 4.5 klade za cíl rozšířit praktický rozsah o pokroky v... vytrvalost pozornosti, používání nástrojů a produktivita, udržování obezřetné strategie v oblasti bezpečnosti a sladění.
Klíčové funkce a vylepšení výkonu

Podle Anthropica, Claude Sonnet 4.5 je schopen udržet soustředění po dobu delší než 30 hodin na složitých úkolech. a vícekrokový, který upřednostňuje dlouhé projekty, kde je vyžadována kontinuita kontextu. Podporuje také výstupy až 64 000 tokenů v jedné odpovědia nabízí ovládací prvky pro úpravu „doby na přemýšlení“ před odpovědí, přičemž dle potřeby vyvažuje rychlost a detaily.
Při reálných úkolech před počítačem, Společnost v OSWorld hlásí 61,4 %, což je výrazný skok oproti 42,2 % u jejího předchůdce ve stejném testu.V praktických situacích může model procházet web, vyplňovat tabulky a provádět akce v desktopových aplikacích z rozšíření Chrome, což snižuje nepřetržité sledování uživatelů.
Země Programování soustředí většinu vylepšeníV rámci ověřeného hodnocení SWE-bench, které se zaměřilo na kódování aplikované na reálné projekty, Sonnet 4.5 vede se 77,2 % (s konfiguracemi, které zvyšují počet při paralelním výpočtu). Anthropic navrhuje, aby model pokrýval celý vývojový cyklus: plánování, implementace, refaktoring a údržba rozsáhlých kódových bází.
Kromě čistého vývoje, Antropické identifikuje použití, která vyžadují prodloužené toky a koordinaci kroků.Od kybernetické bezpečnosti a financí až po kancelářskou produktivitu a výzkum využívající interní i externí data. V těchto kontextech spočívá slib ve stabilnějších agentech schopných dlouhodobě pracovat bez ztráty konzistence.
Nástroje a ekosystém pro vývojáře

Uvedení na trh je doprovázeno Co je nového u Claude Code: kontrolní body uložit postup a vrátit se do předchozích stavů, například historie verzí, One přepracované rozhraní terminálu, nativní rozšíření pro Visual Studio Code a vylepšení úprav kontextu a paměti prostřednictvím API pro spouštění delších úloh.
Anthropic má také premiéru SDK agenta Claude, která replikuje infrastrukturu, kterou společnost používá k budování vlastních agentůSada nabízí nástroje pro dlouhodobou paměť, systémy oprávnění a koordinaci subagentů, což usnadňuje vytváření automatizovaných řešení, která spolupracují na společných cílech a zabezpečují propojení s nástroji, jako jsou... WireGuard.
Jako doplněk, Firma dočasně umožňuje program „Představte si s Claudem“, demonstrace, která nám umožňuje pozorovat, jak model generuje software v reálném čase Žádný předdefinovaný kód. Tato ukázka, která je po omezenou dobu dostupná pro uživatele s verzí Max, ilustruje potenciál modelu pro interaktivní tvorbu.
Bezpečnost, sladění a odolnost
Anthropic zahrnuje Sonnet 4.5 ve své úrovni ochrany Úroveň bezpečnosti umělé inteligence 3 (ASL-3), s filtry vycvičenými k detekci nebezpečného obsahu, zejména obsahu souvisejícího s riziky CBRN. Společnost tvrdí, že snížila desetinásobně více falešně pozitivních výsledků ve srovnání s původní verzí těchto klasifikátorů a nabízí Kontinuita konverzace se Sonnet 4 v případě bezpečnostního zablokování.
Současně společnost zajišťuje, že Model omezuje nežádoucí chování, jako je lichocení nebo klamné reakce, a posiluje obranu proti pokusům o rychlá injekceTato opatření poukazují na použití spolehlivější v korporátním prostředí, kde provádění automatizovaných akcí vyžaduje kontroly a sledovatelnost.
Dostupnost, platformy a ceny

Claude Sonnet 4.5 je k dispozici na Claude.ai (web, iOS a Android) a pro vývojáře prostřednictvím platformy Claude Developer Platform, s integrací do služeb, jako jsou Amazon Bedrock a Google Cloud Vertex AI. Bezplatný tarif funguje s limitem relací, který se resetuje každých pět hodin, a s proměnlivým počtem zpráv na vyžádání. Ceny zůstávají stejné.3 dolary za milion vstupních tokenů a 15 dolarů za milion výstupních tokenů.
Mezi novými funkcemi přístupu Rozšíření Claude pro Chrome se zavádí pro uživatele verze Max. dříve registrovaný na čekací listině. Ačkoli benchmarky naznačují podstatné zlepšení ve srovnání s předchozími iteracemi, Anthropic poznamenává, že skutečný výkon závisí na případu užití a rozpočtu na uvažování nakonfigurovaném pro každý úkol.
Díky kombinaci pokroků v kódování, větší autonomie agentů a přísnějšího zaměření na bezpečnost, Claude Sonnet 4.5 je prezentován jako solidní volba. pro technické týmy, které potřebují kontinuitu a kontrolu v dlouhých procesech, udržování stabilních nákladů a kompatibility s již nasazeným ekosystémem Anthropic.
Jsem technologický nadšenec, který ze svých „geekovských“ zájmů udělal profesi. Strávil jsem více než 10 let svého života používáním nejmodernějších technologií a vrtáním se všemi druhy programů z čisté zvědavosti. Nyní se specializuji na počítačovou techniku a videohry. Je to proto, že již více než 5 let píšu pro různé webové stránky o technologiích a videohrách a tvořím články, které se vám snaží poskytnout informace, které potřebujete, v jazyce, který je srozumitelný všem.
Pokud máte nějaké dotazy, mé znalosti sahají od všeho, co se týká operačního systému Windows a také Androidu pro mobilní telefony. A můj závazek je vůči vám, jsem vždy ochoten strávit pár minut a pomoci vám vyřešit jakékoli otázky, které můžete mít v tomto internetovém světě.