- Έχει απόδοση 61,4% στο OSWorld και ηγείται στο SWE-bench Verified
- Χειρίζεται πολύπλοκες εργασίες για περισσότερες από 30 ώρες και δημιουργεί έως και 64.000 διακριτικά (tokens)
- Ενημερώσεις στον Κώδικα Claude και στο νέο SDK του Claude Agent για πράκτορες
- Βελτιωμένη ασφάλεια (ASL-3) και ίδια τιμή: 3$/15$ ανά εκατομμύριο tokens
Η Anthropic κυκλοφόρησε το Claude Sonnet 4.5, μια εξέλιξη που επικεντρώνεται στον προγραμματισμό, τους πράκτορες και τον έλεγχο υπολογιστών και επιδιώκει να εδραιώσει την πλατφόρμα σε επαγγελματικά περιβάλλοντα. Σε ένα τοπίο με ανταγωνιστές υψηλού επιπέδου, η εταιρεία περιγράφει αυτήν την έκδοση ως την... πιο εκλεπτυσμένο και χρήσιμο μοντέλο για μηχανικές εργασίες μέχρι σήμερα
Η νέα έκδοση βασίζεται στο ιστορικό της οικογένειας Sonnet, η οποία είχε ήδη βελτιώσει τη συλλογιστική και τον προγραμματισμό σε προηγούμενες εκδόσεις. Βασιζόμενη σε αυτό το θεμέλιο, η έκδοση 4.5 στοχεύει να επεκτείνει το πρακτικό πεδίο εφαρμογής με εξελίξεις στον τομέα... επιμονή στην προσοχή, τη χρήση εργαλείων και την παραγωγικότητα, διατηρώντας μια συνετή στρατηγική σε θέματα ασφάλειας και ευθυγράμμισης.
Βασικές δυνατότητες και βελτιώσεις απόδοσης

Σύμφωνα με τον Ανθρώπικο, Το Claude Sonnet 4.5 είναι ικανό να διατηρεί την εστίαση για περισσότερες από 30 ώρες σε πολύπλοκες εργασίες. και πολλαπλών βημάτων, το οποίο ευνοεί μεγάλα έργα όπου απαιτείται συνέχεια του πλαισίου. Υποστηρίζει επίσης αποτελέσματα έως και 64.000 διακριτικά σε μία μόνο απάντησηκαι προσφέρει χειριστήρια για την προσαρμογή του «χρόνου σκέψης» πριν από την απάντηση, εξισορροπώντας την ταχύτητα και τη λεπτομέρεια ανάλογα με τις ανάγκες.
Σε πραγματικές εργασίες μπροστά στον υπολογιστή, Η εταιρεία αναφέρει ποσοστό 61,4% στο OSWorld, ένα αξιοσημείωτο άλμα από το 42,2% του προκατόχου της στην ίδια δοκιμή.Σε πρακτικά σενάρια, το μοντέλο μπορεί να περιηγηθείτε στον ιστό, συμπληρώστε υπολογιστικά φύλλα και εκτελέστε ενέργειες σε εφαρμογές επιφάνειας εργασίας από την επέκταση Chrome, μειώνοντας τη συνεχή παρακολούθηση των χρηστών.
Η γη του Ο προγραμματισμός επικεντρώνεται στις περισσότερες βελτιώσειςΣτην επαληθευμένη αξιολόγηση SWE-bench, η οποία επικεντρώθηκε στον κώδικα που εφαρμόζεται σε έργα πραγματικού κόσμου, Το Sonnet 4.5 προηγείται με 77,2% (με διαμορφώσεις που αυξάνουν τον αριθμό υπό παράλληλη υπολογιστική). Η Anthropic προτείνει ότι το μοντέλο καλύπτει ολόκληρο τον κύκλο ανάπτυξης: σχεδιασμός, υλοποίηση, αναδιαμόρφωση και συντήρηση μεγάλων βάσεων κώδικα.
Πέρα από την καθαρή ανάπτυξη, Το Anthropic προσδιορίζει χρήσεις που απαιτούν παρατεταμένες ροές και συντονισμό βημάτων.Από την κυβερνοασφάλεια και τα χρηματοοικονομικά έως την παραγωγικότητα γραφείου και την έρευνα με τη χρήση εσωτερικών και εξωτερικών δεδομένων. Σε αυτά τα πλαίσια, η υπόσχεση έγκειται σε πιο σταθερούς παράγοντες ικανούς να διατηρούν μακροπρόθεσμη εργασία χωρίς να χάνουν τη συνέπειά τους.
Εργαλεία και Οικοσύστημα Προγραμματιστών

Η κυκλοφορία συνοδεύεται από Τι νέο υπάρχει στην Claude Code: σημεία ελέγχου για να αποθηκεύσετε την πρόοδο και να επιστρέψετε σε προηγούμενες καταστάσεις, όπως π.χ. ιστορικό έκδοσης, Ένα ανανεωμένη διεπαφή τερματικού, εγγενής επέκταση για τον κώδικα του Visual Studio και βελτιώσεις στην επεξεργασία περιεχομένου και μνήμης μέσω του API για την εκτέλεση μεγαλύτερων εργασιών.
Το Anthropic κάνει επίσης πρεμιέρα στο επεισόδιο SDK του Claude Agent, η οποία αναπαράγει την υποδομή που χρησιμοποιεί η εταιρεία για να δημιουργήσει τους δικούς της πράκτορεςΤο κιτ προσφέρει εργαλεία για μακροπρόθεσμη μνήμη, συστήματα δικαιωμάτων και συντονισμό υποπρακτόρων, διευκολύνοντας τη δημιουργία αυτοματοποιημένων λύσεων που συνεργάζονται για την επίτευξη κοινών στόχων και την ασφαλή συνδεσιμότητα με εργαλεία όπως WireGuard.
Ως συμπλήρωμα, Η εταιρεία ενεργοποιεί προσωρινά το «Imagine with Claude», μια επίδειξη που μας επιτρέπει να παρατηρήσουμε πώς λειτουργεί το μοντέλο παράγει λογισμικό σε πραγματικό χρόνο Δεν υπάρχει προκαθορισμένος κώδικας. Αυτή η προεπισκόπηση, διαθέσιμη για περιορισμένο χρονικό διάστημα σε χρήστες Max, καταδεικνύει τις δυνατότητες του μοντέλου για διαδραστική δημιουργία.
Ασφάλεια, ευθυγράμμιση και ανθεκτικότητα
Το Anthropic περιλαμβάνει το Sonnet 4.5 στο επίπεδο προστασίας του Επίπεδο ασφάλειας τεχνητής νοημοσύνης 3 (ASL-3), με φίλτρα εκπαιδευμένα να ανιχνεύουν επικίνδυνο περιεχόμενο, ειδικά εκείνο που σχετίζεται με ΧΒΡΠ κινδύνους. Η εταιρεία ισχυρίζεται ότι έχει μειώσει ψευδώς θετικά κατά δέκα φορές σε σύγκριση με την αρχική έκδοση αυτών των ταξινομητών και προσφέρει Συνέχεια συνομιλίας με το Sonnet 4 σε περίπτωση κλειδώματος ασφαλείας.
Παράλληλα, η εταιρεία διασφαλίζει ότι Το μοντέλο μειώνει ανεπιθύμητες συμπεριφορές όπως κολακεία ή παραπλανητικές απαντήσεις και ενισχύει την άμυνα ενάντια στις προσπάθειες έγκαιρη ένεσηΑυτά τα μέτρα υποδεικνύουν τη χρήση πιο αξιόπιστο σε εταιρικά περιβάλλοντα, όπου η εκτέλεση αυτοματοποιημένων ενεργειών απαιτεί ελέγχους και ιχνηλασιμότητα.
Διαθεσιμότητα, πλατφόρμες και τιμές

Το Claude Sonnet 4.5 είναι διαθέσιμο στο Claude.ai (ιστός, iOS και Android) και για προγραμματιστές μέσω της πλατφόρμας προγραμματιστών Claude, με ενσωμάτωση σε υπηρεσίες όπως το Amazon Bedrock και το Google Cloud Vertex AI. Το δωρεάν πρόγραμμα λειτουργεί με όριο συνεδρίας που επαναφέρεται κάθε πέντε ώρες και μεταβλητό αριθμό μηνυμάτων κατ' απαίτηση. Οι τιμές παραμένουν οι ίδιες.: 3 δολάρια ανά εκατομμύριο διακριτικά εισόδου και 15 δολάρια ανά εκατομμύριο διακριτικά εξόδου.
Μεταξύ των νέων δυνατοτήτων πρόσβασης, Η επέκταση Chrome του Claude είναι διαθέσιμη στους χρήστες Max. προηγουμένως εγγεγραμμένο στη λίστα αναμονής. Παρόλο που τα benchmarks υποδηλώνουν σημαντικές βελτιώσεις σε σύγκριση με προηγούμενες εκδόσεις, το Anthropic σημειώνει ότι η πραγματική απόδοση εξαρτάται από την περίπτωση χρήσης και τον προϋπολογισμό συλλογισμού που έχει διαμορφωθεί για κάθε εργασία.
Με έναν συνδυασμό προόδων στον προγραμματισμό, μεγαλύτερης αυτονομίας για τους πράκτορες και αυστηρότερης εστίασης στην ασφάλεια, Το Claude Sonnet 4.5 τοποθετείται ως μια σταθερή επιλογή για τεχνικές ομάδες που χρειάζονται συνέχεια και έλεγχο σε μακρόχρονες διαδικασίες, διατηρώντας σταθερό κόστος και συμβατότητα με το ήδη αναπτυγμένο οικοσύστημα της Anthropic.
Είμαι λάτρης της τεχνολογίας που έχει μετατρέψει τα «γκικ» ενδιαφέροντά του σε επάγγελμα. Έχω περάσει περισσότερα από 10 χρόνια της ζωής μου χρησιμοποιώντας τεχνολογία αιχμής και ασχολούμαι με όλα τα είδη προγραμμάτων από καθαρή περιέργεια. Τώρα έχω ειδικευτεί στην τεχνολογία υπολογιστών και στα βιντεοπαιχνίδια. Αυτό οφείλεται στο γεγονός ότι για περισσότερα από 5 χρόνια εργάζομαι γράφοντας για διάφορους ιστότοπους σχετικά με την τεχνολογία και τα βιντεοπαιχνίδια, δημιουργώντας άρθρα που επιδιώκουν να σας δώσουν τις πληροφορίες που χρειάζεστε σε μια γλώσσα κατανοητή από όλους.
Αν έχετε απορίες, οι γνώσεις μου κυμαίνονται από οτιδήποτε σχετίζεται με το λειτουργικό σύστημα Windows καθώς και με Android για κινητά τηλέφωνα. Και η δέσμευσή μου είναι απέναντί σας, είμαι πάντα πρόθυμος να αφιερώσω λίγα λεπτά και να σας βοηθήσω να επιλύσετε τυχόν απορίες που μπορεί να έχετε σε αυτόν τον κόσμο του Διαδικτύου.