Claude Sonnet 4.5: Përmirësime në Kodin, Agjentin dhe Sigurinë

Performon 61,4% në OSWorld dhe kryeson në SWE-bench. Verifikuar.
Përballon detyra komplekse për më shumë se 30 orë dhe gjeneron deri në 64.000 tokena
Përditësime për Kodin Claude dhe SDK-në e re të Agjentit Claude për agjentët
Siguri e përmirësuar (ASL-3) dhe i njëjti çmim: 3 dollarë/15 dollarë për milion tokenë

Imazh i modelit Claude Sonnet 4.5

Anthropic ka publikuar Claude Sonnet 4.5, një version evolucionar i fokusuar në programim, agjentë dhe kontroll kompjuterik që synon të konsolidojë platformën në mjedise profesionale. Në një peizazh me rivalë të nivelit të lartë, kompania e përshkruan këtë version si versionin e saj... model më i rafinuar dhe i dobishëm për detyrat inxhinierike deri në datën.

Versioni i ri mbështetet në historikun e familjes Sonnet, e cila kishte përmirësuar tashmë arsyetimin dhe kodimin në versionet e mëparshme. Duke u bazuar në këtë themel, versioni 4.5 synon të zgjerojë fushëveprimin praktik me përparime në këmbëngulja e vëmendjes, përdorimi i mjeteve dhe produktiviteti, duke ruajtur një strategji të kujdesshme në siguri dhe harmonizim.

Aftësitë kryesore dhe përmirësimet e performancës

Imazh i përgjithshëm i Claude Sonnet 4.5

Sipas Antropikut, Claude Sonnet 4.5 është i aftë të ruajë përqendrimin për më shumë se 30 orë në detyra komplekse. dhe shumë-hapësh, i cili favorizon projektet e gjata ku kërkohet vazhdimësi e kontekstit. Gjithashtu mbështet rezultate deri në 64.000 tokena në një përgjigje të vetme, dhe ofron kontrolle për të rregulluar "kohën e të menduarit" para se të përgjigjeni, duke balancuar shpejtësinë dhe detajet sipas nevojës.

Përmbajtje ekskluzive - Kliko këtu 12GB apo 9GB? Pixel 10 rezervon 3GB për inteligjencën artificiale për të përmirësuar reagimin, në kurriz të kryerjes së shumë detyrave njëkohësisht.

Në detyrat reale para kompjuterit, Kompania raporton një përqindje prej 61,4% në OSWorld, një rritje e dukshme nga 42,2% e paraardhësit të saj në të njëjtin test.Në skenarë praktikë, modeli mund të shfletoni uebin, plotësoni fletëllogaritëse dhe kryeni veprime në aplikacionet e desktopit nga shtesa Chrome, duke zvogëluar monitorimin e vazhdueshëm të përdoruesit.

Toka e Programimi përqendron shumicën e përmirësimeveNë vlerësimin e verifikuar SWE-bench, i cili u përqendrua në kodimin e aplikuar në projekte të botës reale, Sonnet 4.5 kryeson me 77,2% (me konfigurime që rrisin numrin nën llogaritjen paralele). Anthropic propozon që modeli të mbulojë të gjithë ciklin e zhvillimit: planifikim, zbatim, rifaktorizim dhe mirëmbajtje të bazave të mëdha të kodit.

Përtej zhvillimit të pastër, Anthropic identifikon përdorimet që kërkojnë rrjedha të zgjatura dhe koordinim të hapave.Nga siguria kibernetike dhe financat te produktiviteti në zyrë dhe kërkimi duke përdorur të dhëna të brendshme dhe të jashtme. Në këto kontekste, premtimi qëndron te agjentë më të qëndrueshëm të aftë për të mbështetur punën afatgjatë pa humbur qëndrueshmërinë.

Mjetet dhe Ekosistemi i Zhvilluesit

Klod Kod

Lansimi vjen i shoqëruar nga Çfarë ka të re te Claude Code: pikat e kontrollit për të ruajtur progresin dhe për t'u kthyer në gjendjet e mëparshme, si p.sh. historia e versionit, Një ndërfaqja e terminalit e ripërpunuar, zgjerim vendas për Kodin e Visual Studio dhe përmirësime në redaktimin e kontekstit dhe memories nëpërmjet API-t për të ekzekutuar detyra më të gjata.

Përmbajtje ekskluzive - Kliko këtu Si mund të konfigurohen njoftimet Alexa?

Anthropic gjithashtu premieron SDK e Agjentit Claude, e cila kopjon infrastrukturën që kompania përdor për të ndërtuar agjentët e vetSeti ofron mjete për kujtesën afatgjatë, sistemet e lejeve dhe koordinimin e nënagjentëve, duke lehtësuar krijimin e zgjidhjeve të automatizuara që bashkëpunojnë drejt qëllimeve të përbashkëta dhe lidhjes së sigurt me mjete të tilla si WireGuard.

Si plotësues, Firma mundëson përkohësisht “Imagine with Claude”, një demonstrim që na lejon të vëzhgojmë se si modeli gjeneron softuer në kohë reale Pa kod të paracaktuar. Ky parapamje, e disponueshme për një kohë të kufizuar për përdoruesit Max, ilustron potencialin e modelit për krijim interaktiv.

Siguria, harmonizimi dhe qëndrueshmëria

Anthropic përfshin Sonnet 4.5 në nivelin e tij të mbrojtjes Niveli i Sigurisë së IA-së 3 (ASL-3), me filtra të trajnuar për të zbuluar përmbajtje të rrezikshme, veçanërisht ato që lidhen me rreziqet CBRN. Kompania pretendon se ka zvogëluar pozitive të rreme me një faktor dhjetë krahasuar me versionin fillestar të këtyre klasifikuesve, dhe ofron Vazhdimësia e bisedës me Sonnet 4 nëse ndodh një bllokim sigurie.

Paralelisht, kompania siguron që Modeli zvogëlon sjelljet e padëshiruara siç janë lajkat ose përgjigjet mashtruese dhe forcon mbrojtjen kundër përpjekjeve për të injeksion i menjëhershëmKëto masa tregojnë një përdorim më i besueshëm në mjediset e korporatave, ku ekzekutimi i veprimeve të automatizuara kërkon kontrolle dhe gjurmueshmëri.

Përmbajtje ekskluzive - Kliko këtu Ne shpjegojmë se si funksionojnë kreditet e inteligjencës artificiale për Microsoft 365.

Disponueshmëria, platformat dhe çmimet

Imazh nga Claude Sonnet 4.5

Claude Sonnet 4.5 është i disponueshëm në Claude.ai (ueb, iOS dhe Android) dhe për zhvilluesit përmes Platformës së Zhvilluesve Claude, me integrimin në shërbime të tilla si Amazon Bedrock dhe Google Cloud Vertex AI. Plani falas funksionon me një limit seancash që rivendoset çdo pesë orë dhe një numër të ndryshueshëm mesazhesh sipas kërkesës. Çmimet mbeten të njëjta.: 3 dollarë për milion tokenë hyrës dhe 15 dollarë për milion tokenë dalës.

Ndër veçoritë e reja të aksesit, Shtesa e Claude për Chrome po lançohet për përdoruesit Max. të regjistruar më parë në listën e pritjes. Edhe pse testet e referencës sugjerojnë përmirësime të konsiderueshme krahasuar me versionet e mëparshme, Anthropic vëren se performanca aktuale varet nga rasti i përdorimit dhe buxheti i arsyetimit i konfiguruar për secilën detyrë.

Me një kombinim të përparimeve në kodim, autonomisë më të madhe për agjentët dhe një fokus më të rreptë në siguri, Claude Sonnet 4.5 pozicionohet si një opsion i fortë për ekipet teknike që kanë nevojë për vazhdimësi dhe kontroll në procese të gjata, duke ruajtur kostot dhe përputhshmërinë e qëndrueshme me ekosistemin tashmë të vendosur të Anthropic.

rregullimi i LinkedIn në inteligjencën artificiale

Artikulli i lidhur:

LinkedIn përshtat inteligjencën e tij artificiale: ndryshimet në privatësi, rajonet dhe si ta çaktivizoni atë

Alberto navarro

Unë jam një entuziast i teknologjisë që i kam kthyer në profesion interesat e tij "geek". Kam shpenzuar më shumë se 10 vjet të jetës sime duke përdorur teknologjinë më të fundit dhe duke punuar me të gjitha llojet e programeve nga kurioziteti i pastër. Tani jam specializuar në teknologjinë kompjuterike dhe videolojërat. Kjo sepse prej më shumë se 5 vitesh shkruaj për faqe të ndryshme interneti mbi teknologjinë dhe videolojërat, duke krijuar artikuj që kërkojnë t'ju japin informacionin që ju nevojitet në një gjuhë të kuptueshme nga të gjithë.

Nëse keni ndonjë pyetje, njohuritë e mia variojnë nga gjithçka që lidhet me sistemin operativ Windows si dhe Android për telefonat celularë. Dhe angazhimi im është për ju, unë jam gjithmonë i gatshëm të kaloj disa minuta dhe t'ju ndihmoj të zgjidhni çdo pyetje që mund të keni në këtë botë të internetit.