Sonetul 4.5 al lui Claude: Salt în programare, agenți și utilizarea computerului

Ultima actualizare: 02/10/2025

  • Are o performanță de 61,4% în OSWorld și este lider în SWE-bench. Verificat.
  • Gestionează sarcini complexe timp de peste 30 de ore și generează până la 64.000 de token-uri
  • Actualizări ale codului Claude și ale noului SDK Claude Agent pentru agenți
  • Securitate îmbunătățită (ASL-3) și același preț: 3 USD/15 USD pe milion de token-uri

Imagine a modelului Claude Sonnet 4.5

Anthropic a lansat Claude Sonnet 4.5, o evoluție axată pe programare, agenți și controlul computerelor, care își propune să consolideze platforma în medii profesionale. Într-un peisaj cu rivali de nivel înalt, compania descrie această versiune ca fiind... model mai rafinat și mai util pentru sarcini inginerești până în prezent

Noua versiune se bazează pe experiența familiei Sonnet, care deja îmbunătățise raționamentul și codarea în iterațiile anterioare. Bazându-se pe această fundație, versiunea 4.5 își propune să extindă domeniul de aplicare practic cu progrese în... persistența atenției, utilizarea instrumentelor și productivitatea, menținând o strategie prudentă în materie de securitate și aliniere.

Capacități cheie și îmbunătățiri de performanță

Imagine generică a Sonetului 4.5 al lui Claude

Conform Anthropic, Claude Sonnet 4.5 este capabil să își mențină concentrarea timp de peste 30 de ore în rezolvarea unor sarcini complexe. și cu mai mulți pași, ceea ce favorizează proiectele lungi unde este necesară continuitatea contextului. De asemenea, acceptă rezultate de până la 64.000 de tokenuri într-un singur răspunsși oferă comenzi pentru ajustarea „timpului de gândire” înainte de răspuns, echilibrând viteza și detaliile după cum este necesar.

Conținut exclusiv - Faceți clic aici  Cum să remediați problemele comune ChatGPT

În sarcini reale în fața calculatorului, Compania raportează un scor de 61,4% în OSWorld, o creștere notabilă față de 42,2% înregistrat de predecesorul său în același test.În scenarii practice, modelul poate navigați pe web, completați foi de calcul și efectuați acțiuni în aplicațiile desktop din extensia Chrome, reducând monitorizarea continuă a utilizatorilor.

Țara lui Programarea concentrează majoritatea îmbunătățirilorÎn evaluarea SWE-bench Verified, care s-a concentrat pe codarea aplicată proiectelor din lumea reală, Sonnet 4.5 este lider cu 77,2% (cu configurații care cresc numărul în condiții de calcul paralel). Anthropic propune ca modelul să acopere întregul ciclu de dezvoltare: planificarea, implementarea, refactorizarea și întreținerea bazelor de cod mari.

Dincolo de pura dezvoltare, Antropic identifică utilizări care necesită fluxuri prelungite și coordonarea pașilor.De la securitate cibernetică și finanțe până la productivitatea la birou și cercetare folosind date interne și externe. În aceste contexte, promisiunea constă în agenți mai stabili, capabili să susțină munca pe termen lung fără a pierde din consecvență.

Instrumente și ecosistem pentru dezvoltatori

Claude Code

Lansarea vine însoțită de Ce este nou la Claude Code: puncte de control pentru a salva progresul și a reveni la stările anterioare, cum ar fi versiunea istorică, One interfață de terminal reînnoită, extensie nativă pentru Visual Studio Code și îmbunătățiri ale editării contextului și memoriei prin intermediul API-ului pentru a rula sarcini mai lungi.

Conținut exclusiv - Faceți clic aici  Un cuplu a condus mai mult de trei ore pentru a vedea un loc care nu exista: inteligența artificială generează deja destinații turistice false.

Anthropic are, de asemenea, premiera SDK-ul pentru agenți Claude, care reproduce infrastructura pe care compania o folosește pentru a-și construi proprii agențiKitul oferă instrumente pentru memoria pe termen lung, sisteme de permisiuni și coordonarea subagenților, facilitând crearea de soluții automate care cooperează către obiective comune și asigură conectivitatea cu instrumente precum WireGuard.

Ca o completare, Firma activează temporar „Imagine with Claude”, o demonstrație care ne permite să observăm cum funcționează modelul generează software în timp real Niciun cod predefinit. Această previzualizare, disponibilă pentru o perioadă limitată de timp pentru numărul maxim de utilizatori, ilustrează potențialul modelului pentru crearea interactivă.

Securitate, aliniere și reziliență

Anthropic include Sonnet 4.5 în nivelul său de protecție Nivelul de siguranță AI 3 (ASL-3), cu filtre antrenate pentru a detecta conținut periculos, în special cele legate de riscurile CBRN. Compania susține că a redus fals pozitive cu un factor de zece comparativ cu versiunea inițială a acestor clasificatoare și oferă Continuitatea conversației cu Sonnet 4 în cazul unei blocări de securitate.

În paralel, compania se asigură că Modelul reduce comportamentele nedorite, cum ar fi lingușirea sau răspunsurile înșelătoare, și întărește apărarea împotriva încercărilor de a... injectare promptăAceste măsuri indică o utilizare mai fiabil în mediile corporative, unde executarea acțiunilor automatizate necesită controale și trasabilitate.

Conținut exclusiv - Faceți clic aici  Claude și câinele robot: ce a arătat experimentul antropic

Disponibilitate, platforme și prețuri

Imagine de Claude Sonnet 4.5

Sonetul lui Claude 4.5 este disponibil pe Claude.ai (web, iOS și Android) și pentru dezvoltatori prin intermediul platformei Claude Developer, cu integrare în servicii precum Amazon Bedrock și Google Cloud Vertex AI. Planul gratuit funcționează cu o limită de sesiuni care se resetează la fiecare cinci ore și un număr variabil de mesaje la cerere. Prețurile rămân aceleași.3 dolari pe milion de tokenuri de intrare și 15 dolari pe milion de tokenuri de ieșire.

Printre noile funcții de acces, Extensia Chrome a lui Claude este lansată pentru utilizatorii Max. înregistrați anterior pe lista de așteptare. Deși testele de performanță sugerează îmbunătățiri substanțiale în comparație cu iterațiile anterioare, Anthropic observă că performanța reală depinde de cazul de utilizare și de bugetul de raționament configurat pentru fiecare sarcină.

Cu o combinație de progrese în codare, o autonomie mai mare pentru agenți și o concentrare mai strictă asupra securității, Claude Sonnet 4.5 se poziționează ca o opțiune solidă pentru echipele tehnice care au nevoie de continuitate și control în procesele lungi, menținerea unor costuri stabile și a compatibilității cu ecosistemul deja implementat al Anthropic.

ajustare LinkedIn AI
Articol asociat:
LinkedIn își ajustează inteligența artificială: modificări ale confidențialității, regiuni și cum să o dezactivați