კლოდ სონეტი 4.5: ნახტომი კოდირებაში, აგენტებსა და კომპიუტერის გამოყენებაში

Ბოლო განახლება: 02/10/2025

  • OSWorld-ში მისი მაჩვენებელი 61,4%-ია და SWE-bench-ში ლიდერობს. Verified
  • რთულ ამოცანებს 30 საათზე მეტი ხნის განმავლობაში უმკლავდება და 64 000-მდე ტოკენს წარმოქმნის
  • Claude Code-ის და აგენტებისთვის განკუთვნილი ახალი Claude Agent SDK-ის განახლებები
  • გაძლიერებული უსაფრთხოება (ASL-3) და იგივე ფასი: $3/$15 მილიონ ტოკენზე

Claude Sonnet 4.5 მოდელის სურათი

Anthropic-მა გამოუშვა Claude Sonnet 4.5, ევოლუციური ვერსია, რომელიც ორიენტირებულია პროგრამირებაზე, აგენტებსა და კომპიუტერული კონტროლზე და ცდილობს პლატფორმის კონსოლიდაციას პროფესიულ გარემოში. მაღალი დონის კონკურენტების ფონზე, კომპანია ამ გამოშვებას აღწერს, როგორც მის... უფრო დახვეწილი და სასარგებლო მოდელი საინჟინრო ამოცანებისთვის დღემდე.

ახალი ვერსია ეფუძნება Sonnet-ის ოჯახის გამოცდილებას, რომელმაც უკვე გააუმჯობესა მსჯელობა და კოდირება წინა იტერაციებში. ამ საფუძველზე დაყრდნობით, 4.5 გეგმავს პრაქტიკული მასშტაბის გაფართოებას მიღწევებით. ყურადღების შეუპოვრობა, ხელსაწყოების გამოყენება და პროდუქტიულობა, უსაფრთხოებისა და ჰარმონიზაციის გონივრული სტრატეგიის შენარჩუნებით.

ძირითადი შესაძლებლობები და შესრულების გაუმჯობესება

კლოდ სონეტის 4.5-ის ზოგადი სურათი

ანთროპიკის თანახმად, Claude Sonnet 4.5-ს შეუძლია კომპლექსურ დავალებებზე ფოკუსირების შენარჩუნება 30 საათზე მეტი ხნის განმავლობაში. და მრავალსაფეხურიანი, რაც უპირატესობას ანიჭებს ხანგრძლივ პროექტებს, სადაც საჭიროა კონტექსტის უწყვეტობა. ის ასევე მხარს უჭერს მაქსიმუმ 64.000 ტოკენი ერთ პასუხშიდა გთავაზობთ კონტროლის მექანიზმებს პასუხის გაცემამდე „ფიქრის დროის“ რეგულირებისთვის, საჭიროებისამებრ სიჩქარისა და დეტალების დაბალანსებისთვის.

ექსკლუზიური შინაარსი - დააწკაპუნეთ აქ  YouTube აძლიერებს პოლიტიკას მასობრივი წარმოებისა და ხელოვნური ინტელექტით მართული ვიდეოების წინააღმდეგ

კომპიუტერის წინ რეალურ დავალებებში, კომპანია OSWorld-ში 61,4%-იან მაჩვენებელს აფიქსირებს, რაც მნიშვნელოვანი ზრდაა მისი წინამორბედის 42,2%-იან მაჩვენებელთან შედარებით, რომელიც იმავე ტესტში დაფიქსირდა.პრაქტიკულ სიტუაციებში, მოდელს შეუძლია დაათვალიერეთ ვები, შეავსეთ ცხრილები და შეასრულეთ მოქმედებები Chrome გაფართოებიდან დესკტოპის აპლიკაციებში, რაც ამცირებს მომხმარებლის უწყვეტ მონიტორინგს.

მიწა პროგრამირება გაუმჯობესებების უმეტესობას ამახვილებს ყურადღებასSWE-bench Verified შეფასებაში, რომელიც ფოკუსირებული იყო რეალურ პროექტებში გამოყენებულ კოდირებაზე, Sonnet 4.5 ლიდერობს 77,2%-ით (კონფიგურაციებით, რომლებიც ზრდის რაოდენობას პარალელური გამოთვლების დროს). Anthropic გვთავაზობს, რომ მოდელი მოიცავდეს მთელ განვითარების ციკლს: დიდი კოდის ბაზების დაგეგმვა, განხორციელება, რეფაქტორინგი და მოვლა-პატრონობა.

სუფთა განვითარების მიღმა, ანთროპიკი განსაზღვრავს გამოყენებებს, რომლებიც მოითხოვს ხანგრძლივ ნაკადებს და ნაბიჯების კოორდინაციას.კიბერუსაფრთხოებიდან და ფინანსებიდან დაწყებული, ოფისის პროდუქტიულობითა და შიდა და გარე მონაცემების გამოყენებით კვლევით დამთავრებული. ამ კონტექსტში, იმედისმომცემია უფრო სტაბილური აგენტები, რომლებსაც შეუძლიათ გრძელვადიანი სამუშაოს შენარჩუნება თანმიმდევრულობის დაკარგვის გარეშე.

დეველოპერის ინსტრუმენტები და ეკოსისტემა

კლოდ კოდი

გაშვებას თან ახლავს სიახლეები კლოდ კოდში: საგუშაგოები პროგრესის შესანახად და წინა მდგომარეობებზე დასაბრუნებლად, მაგალითად ვერსიების ისტორია, ერთი განახლებული ტერმინალის ინტერფეისი, Visual Studio Code-ის მშობლიური გაფართოება და კონტექსტისა და მეხსიერების რედაქტირების გაუმჯობესებები API-ის მეშვეობით უფრო ხანგრძლივი დავალებების შესასრულებლად.

ექსკლუზიური შინაარსი - დააწკაპუნეთ აქ  ანთროპიკი და ხელოვნური ინტელექტის შემთხვევა, რომელმაც მათეთრებლის დალევა ურჩია: როდესაც მოდელები ატყუებენ

„ანთროპიკის“ პრემიერაც ასევე შედგება კლოდ აგენტის SDK, რომელიც ასახავს ინფრასტრუქტურას, რომელსაც კომპანია იყენებს საკუთარი აგენტების შესაქმნელადნაკრები გთავაზობთ ინსტრუმენტებს გრძელვადიანი მეხსიერებისთვის, ნებართვების სისტემებისთვის და სუბაგენტების კოორდინაციისთვის, რაც ხელს უწყობს ავტომატიზირებული გადაწყვეტილებების შექმნას, რომლებიც თანამშრომლობენ საერთო მიზნების მისაღწევად და უსაფრთხო კავშირს უზრუნველყოფენ ისეთ ინსტრუმენტებთან, როგორიცაა WireGuard.

როგორც დამატება, ფირმა დროებით ააქტიურებს „წარმოიდგინე კლოდთან ერთად“-ს, დემონსტრაცია, რომელიც საშუალებას გვაძლევს დავაკვირდეთ, თუ როგორ მუშაობს მოდელი რეალურ დროში ქმნის პროგრამულ უზრუნველყოფას წინასწარ განსაზღვრული კოდი არ არის. ეს წინასწარი მიმოხილვა, რომელიც შეზღუდული დროით ხელმისაწვდომია Max მომხმარებლებისთვის, ასახავს მოდელის პოტენციალს ინტერაქტიული შექმნისთვის.

უსაფრთხოება, ჰარმონიზაცია და მდგრადობა

Anthropic-ის დაცვის დონე მოიცავს Sonnet 4.5-ს ხელოვნური ინტელექტის უსაფრთხოების დონე 3 (ASL-3), სახიფათო კონტენტის აღმოსაჩენად გაწვრთნილი ფილტრებით, განსაკუთრებით ქიმიური, რადიოლოგიური, ბირთვული და ბიოლოგიური რისკების რისკებთან დაკავშირებული კონტენტის აღმოსაჩენად. კომპანია აცხადებს, რომ შეამცირა ცრუ დადებითი შედეგები ათჯერ ამ კლასიფიკატორების საწყის ვერსიასთან შედარებით და გთავაზობთ Sonnet 4-თან საუბრის უწყვეტობა უსაფრთხოების დაბლოკვის შემთხვევაში.

პარალელურად, კომპანია უზრუნველყოფს, რომ მოდელი ამცირებს არასასურველ ქცევებს, როგორიცაა მლიქვნელობა ან მატყუარა პასუხები და აძლიერებს დაცვას მცდელობებისგან. სწრაფი ინექციაეს ზომები მიუთითებს გამოყენებაზე უფრო საიმედო კორპორატიულ გარემოში, სადაც ავტომატიზირებული ქმედებების შესრულება მოითხოვს კონტროლს და მიკვლევადობას.

ექსკლუზიური შინაარსი - დააწკაპუნეთ აქ  Gemini AI-ს ახლა შეუძლია თქვენი მობილური ტელეფონიდან მოძებნოს სიმღერები, როგორიცაა Shazam

ხელმისაწვდომობა, პლატფორმები და ფასები

სურათის ავტორი: კლოდ სონეტი 4.5

კლოდ სონეტი 4.5 ხელმისაწვდომია Claude.ai-ზე (ვებ, iOS და Android) და დეველოპერებისთვის Claude Developer Platform-ის მეშვეობით, ისეთ სერვისებთან ინტეგრაციით, როგორიცაა Amazon Bedrock და Google Cloud Vertex AI. უფასო გეგმა მოქმედებს სესიის ლიმიტით, რომელიც ყოველ ხუთ საათში განახლდება და მოთხოვნისამებრ შეტყობინებების ცვლადი რაოდენობით. ფასები იგივე რჩება.: 3 დოლარი მილიონ შეყვანის ტოკენებზე და 15 დოლარი მილიონ გამოყვანის ტოკენებზე.

ახალ წვდომის ფუნქციებს შორის, Claude's Chrome-ის გაფართოება Max-ის მომხმარებლებისთვისაც გამოდის. ადრე რეგისტრირებული იყო ლოდინის სიაში. მიუხედავად იმისა, რომ საორიენტაციო მაჩვენებლები წინა იტერაციებთან შედარებით მნიშვნელოვან გაუმჯობესებაზე მიუთითებს, Anthropic აღნიშნავს, რომ ფაქტობრივი შესრულება დამოკიდებულია გამოყენების შემთხვევასა და თითოეული დავალებისთვის კონფიგურირებულ მსჯელობის ბიუჯეტზე.

კოდირების მიღწევების, აგენტებისთვის უფრო მეტი ავტონომიისა და უსაფრთხოებაზე უფრო მკაცრი ფოკუსირების კომბინაციით, კლოდ სონეტი 4.5 პოზიციონირებულია, როგორც მყარი ვარიანტი ტექნიკური გუნდებისთვის, რომლებსაც ხანგრძლივი პროცესების უწყვეტობა და კონტროლი სჭირდებათ, სტაბილური ხარჯების შენარჩუნება და Anthropic-ის უკვე განლაგებულ ეკოსისტემასთან თავსებადობა.

LinkedIn-ის რეგულირების ხელოვნური ინტელექტი
დაკავშირებული სტატია:
LinkedIn-ი ხელოვნურ ინტელექტს ცვლის: კონფიდენციალურობის ცვლილებები, რეგიონები და მისი გამორთვის გზები