Claude Sonnet 4.5: Skok v kódování, agentech a používání počítačů

Poslední aktualizace: 02/10/2025

  • V testu OSWorld dosahuje 61,4 % výsledků a v testu SWE-bench Verified vede.
  • Zvládá složité úkoly více než 30 hodin a generuje až 64 000 tokenů
  • Aktualizace Claude Code a nové sady SDK Claude Agent pro agenty
  • Zvýšené zabezpečení (ASL-3) a stejná cena: 3/15 dolarů za milion tokenů

Obrázek modelu Claude Sonnet 4.5

Společnost Anthropic vydala Claude Sonnet 4.5, evolučního vývoje zaměřeného na programování, agenty a ovládání počítačů, jehož cílem je konsolidovat platformu v profesionálním prostředí. V prostředí s vysokou konkurencí společnost popisuje toto vydání jako své... propracovanější a užitečnější model pro inženýrské úkoly k dnešnímu dni.

Nová verze staví na historii rodiny Sonnet, která již v předchozích verzích zlepšila uvažování a kódování. Na tomto základě si verze 4.5 klade za cíl rozšířit praktický rozsah o pokroky v... vytrvalost pozornosti, používání nástrojů a produktivita, udržování obezřetné strategie v oblasti bezpečnosti a sladění.

Klíčové funkce a vylepšení výkonu

Generický obrázek Clauda Sonneta 4.5

Podle Anthropica, Claude Sonnet 4.5 je schopen udržet soustředění po dobu delší než 30 hodin na složitých úkolech. a vícekrokový, který upřednostňuje dlouhé projekty, kde je vyžadována kontinuita kontextu. Podporuje také výstupy až 64 000 tokenů v jedné odpovědia nabízí ovládací prvky pro úpravu „doby na přemýšlení“ před odpovědí, přičemž dle potřeby vyvažuje rychlost a detaily.

Exkluzivní obsah – klikněte zde  Jak používat Microsoft Designer ke zlepšení vašich kreativních projektů

Při reálných úkolech před počítačem, Společnost v OSWorld hlásí 61,4 %, což je výrazný skok oproti 42,2 % u jejího předchůdce ve stejném testu.V praktických situacích může model procházet web, vyplňovat tabulky a provádět akce v desktopových aplikacích z rozšíření Chrome, což snižuje nepřetržité sledování uživatelů.

Země Programování soustředí většinu vylepšeníV rámci ověřeného hodnocení SWE-bench, které se zaměřilo na kódování aplikované na reálné projekty, Sonnet 4.5 vede se 77,2 % (s konfiguracemi, které zvyšují počet při paralelním výpočtu). Anthropic navrhuje, aby model pokrýval celý vývojový cyklus: plánování, implementace, refaktoring a údržba rozsáhlých kódových bází.

Kromě čistého vývoje, Antropické identifikuje použití, která vyžadují prodloužené toky a koordinaci kroků.Od kybernetické bezpečnosti a financí až po kancelářskou produktivitu a výzkum využívající interní i externí data. V těchto kontextech spočívá slib ve stabilnějších agentech schopných dlouhodobě pracovat bez ztráty konzistence.

Nástroje a ekosystém pro vývojáře

Claude Code

Uvedení na trh je doprovázeno Co je nového u Claude Code: kontrolní body uložit postup a vrátit se do předchozích stavů, například historie verzí, One přepracované rozhraní terminálu, nativní rozšíření pro Visual Studio Code a vylepšení úprav kontextu a paměti prostřednictvím API pro spouštění delších úloh.

Exkluzivní obsah – klikněte zde  Jak funguje Wombo AI?

Anthropic má také premiéru SDK agenta Claude, která replikuje infrastrukturu, kterou společnost používá k budování vlastních agentůSada nabízí nástroje pro dlouhodobou paměť, systémy oprávnění a koordinaci subagentů, což usnadňuje vytváření automatizovaných řešení, která spolupracují na společných cílech a zabezpečují propojení s nástroji, jako jsou... WireGuard.

Jako doplněk, Firma dočasně umožňuje program „Představte si s Claudem“, demonstrace, která nám umožňuje pozorovat, jak model generuje software v reálném čase Žádný předdefinovaný kód. Tato ukázka, která je po omezenou dobu dostupná pro uživatele s verzí Max, ilustruje potenciál modelu pro interaktivní tvorbu.

Bezpečnost, sladění a odolnost

Anthropic zahrnuje Sonnet 4.5 ve své úrovni ochrany Úroveň bezpečnosti umělé inteligence 3 (ASL-3), s filtry vycvičenými k detekci nebezpečného obsahu, zejména obsahu souvisejícího s riziky CBRN. Společnost tvrdí, že snížila desetinásobně více falešně pozitivních výsledků ve srovnání s původní verzí těchto klasifikátorů a nabízí Kontinuita konverzace se Sonnet 4 v případě bezpečnostního zablokování.

Současně společnost zajišťuje, že Model omezuje nežádoucí chování, jako je lichocení nebo klamné reakce, a posiluje obranu proti pokusům o rychlá injekceTato opatření poukazují na použití spolehlivější v korporátním prostředí, kde provádění automatizovaných akcí vyžaduje kontroly a sledovatelnost.

Exkluzivní obsah – klikněte zde  Kompletní průvodce používáním Google Veo 3: Metody, požadavky a tipy 2025

Dostupnost, platformy a ceny

Obrázek od Clauda Sonneta 4.5

Claude Sonnet 4.5 je k dispozici na Claude.ai (web, iOS a Android) a pro vývojáře prostřednictvím platformy Claude Developer Platform, s integrací do služeb, jako jsou Amazon Bedrock a Google Cloud Vertex AI. Bezplatný tarif funguje s limitem relací, který se resetuje každých pět hodin, a s proměnlivým počtem zpráv na vyžádání. Ceny zůstávají stejné.3 dolary za milion vstupních tokenů a 15 dolarů za milion výstupních tokenů.

Mezi novými funkcemi přístupu Rozšíření Claude pro Chrome se zavádí pro uživatele verze Max. dříve registrovaný na čekací listině. Ačkoli benchmarky naznačují podstatné zlepšení ve srovnání s předchozími iteracemi, Anthropic poznamenává, že skutečný výkon závisí na případu užití a rozpočtu na uvažování nakonfigurovaném pro každý úkol.

Díky kombinaci pokroků v kódování, větší autonomie agentů a přísnějšího zaměření na bezpečnost, Claude Sonnet 4.5 je prezentován jako solidní volba. pro technické týmy, které potřebují kontinuitu a kontrolu v dlouhých procesech, udržování stabilních nákladů a kompatibility s již nasazeným ekosystémem Anthropic.

úprava LinkedInu AI
Související článek:
LinkedIn upravuje svou umělou inteligenci: změny v ochraně soukromí, regiony a jak ji deaktivovat