Claude Sonnet 4.5: Άλμα στον Κωδικοποίηση, τους Πράκτορες και τη Χρήση Υπολογιστών

Τελευταία ενημέρωση: 02/10/2025

  • Έχει απόδοση 61,4% στο OSWorld και ηγείται στο SWE-bench Verified
  • Χειρίζεται πολύπλοκες εργασίες για περισσότερες από 30 ώρες και δημιουργεί έως και 64.000 διακριτικά (tokens)
  • Ενημερώσεις στον Κώδικα Claude και στο νέο SDK του Claude Agent για πράκτορες
  • Βελτιωμένη ασφάλεια (ASL-3) και ίδια τιμή: 3$/15$ ανά εκατομμύριο tokens

Εικόνα του μοντέλου Claude Sonnet 4.5

Η Anthropic κυκλοφόρησε το Claude Sonnet 4.5, μια εξέλιξη που επικεντρώνεται στον προγραμματισμό, τους πράκτορες και τον έλεγχο υπολογιστών και επιδιώκει να εδραιώσει την πλατφόρμα σε επαγγελματικά περιβάλλοντα. Σε ένα τοπίο με ανταγωνιστές υψηλού επιπέδου, η εταιρεία περιγράφει αυτήν την έκδοση ως την... πιο εκλεπτυσμένο και χρήσιμο μοντέλο για μηχανικές εργασίες μέχρι σήμερα

Η νέα έκδοση βασίζεται στο ιστορικό της οικογένειας Sonnet, η οποία είχε ήδη βελτιώσει τη συλλογιστική και τον προγραμματισμό σε προηγούμενες εκδόσεις. Βασιζόμενη σε αυτό το θεμέλιο, η έκδοση 4.5 στοχεύει να επεκτείνει το πρακτικό πεδίο εφαρμογής με εξελίξεις στον τομέα... επιμονή στην προσοχή, τη χρήση εργαλείων και την παραγωγικότητα, διατηρώντας μια συνετή στρατηγική σε θέματα ασφάλειας και ευθυγράμμισης.

Βασικές δυνατότητες και βελτιώσεις απόδοσης

Γενική εικόνα του Claude Sonnet 4.5

Σύμφωνα με τον Ανθρώπικο, Το Claude Sonnet 4.5 είναι ικανό να διατηρεί την εστίαση για περισσότερες από 30 ώρες σε πολύπλοκες εργασίες. και πολλαπλών βημάτων, το οποίο ευνοεί μεγάλα έργα όπου απαιτείται συνέχεια του πλαισίου. Υποστηρίζει επίσης αποτελέσματα έως και 64.000 διακριτικά σε μία μόνο απάντησηκαι προσφέρει χειριστήρια για την προσαρμογή του «χρόνου σκέψης» πριν από την απάντηση, εξισορροπώντας την ταχύτητα και τη λεπτομέρεια ανάλογα με τις ανάγκες.

Αποκλειστικό περιεχόμενο - Κάντε κλικ εδώ  Το YouTube ενισχύει την πολιτική του κατά των βίντεο μαζικής παραγωγής και με τεχνητή νοημοσύνη

Σε πραγματικές εργασίες μπροστά στον υπολογιστή, Η εταιρεία αναφέρει ποσοστό 61,4% στο OSWorld, ένα αξιοσημείωτο άλμα από το 42,2% του προκατόχου της στην ίδια δοκιμή.Σε πρακτικά σενάρια, το μοντέλο μπορεί να περιηγηθείτε στον ιστό, συμπληρώστε υπολογιστικά φύλλα και εκτελέστε ενέργειες σε εφαρμογές επιφάνειας εργασίας από την επέκταση Chrome, μειώνοντας τη συνεχή παρακολούθηση των χρηστών.

Η γη του Ο προγραμματισμός επικεντρώνεται στις περισσότερες βελτιώσειςΣτην επαληθευμένη αξιολόγηση SWE-bench, η οποία επικεντρώθηκε στον κώδικα που εφαρμόζεται σε έργα πραγματικού κόσμου, Το Sonnet 4.5 προηγείται με 77,2% (με διαμορφώσεις που αυξάνουν τον αριθμό υπό παράλληλη υπολογιστική). Η Anthropic προτείνει ότι το μοντέλο καλύπτει ολόκληρο τον κύκλο ανάπτυξης: σχεδιασμός, υλοποίηση, αναδιαμόρφωση και συντήρηση μεγάλων βάσεων κώδικα.

Πέρα από την καθαρή ανάπτυξη, Το Anthropic προσδιορίζει χρήσεις που απαιτούν παρατεταμένες ροές και συντονισμό βημάτων.Από την κυβερνοασφάλεια και τα χρηματοοικονομικά έως την παραγωγικότητα γραφείου και την έρευνα με τη χρήση εσωτερικών και εξωτερικών δεδομένων. Σε αυτά τα πλαίσια, η υπόσχεση έγκειται σε πιο σταθερούς παράγοντες ικανούς να διατηρούν μακροπρόθεσμη εργασία χωρίς να χάνουν τη συνέπειά τους.

Εργαλεία και Οικοσύστημα Προγραμματιστών

Κλοντ Κοντ

Η κυκλοφορία συνοδεύεται από Τι νέο υπάρχει στην Claude Code: σημεία ελέγχου για να αποθηκεύσετε την πρόοδο και να επιστρέψετε σε προηγούμενες καταστάσεις, όπως π.χ. ιστορικό έκδοσης, Ένα ανανεωμένη διεπαφή τερματικού, εγγενής επέκταση για τον κώδικα του Visual Studio και βελτιώσεις στην επεξεργασία περιεχομένου και μνήμης μέσω του API για την εκτέλεση μεγαλύτερων εργασιών.

Αποκλειστικό περιεχόμενο - Κάντε κλικ εδώ  Anthropic και η περίπτωση της Τεχνητής Νοημοσύνης που συνέστησε την κατανάλωση χλωρίνης: όταν τα μοντέλα απατούν

Το Anthropic κάνει επίσης πρεμιέρα στο επεισόδιο SDK του Claude Agent, η οποία αναπαράγει την υποδομή που χρησιμοποιεί η εταιρεία για να δημιουργήσει τους δικούς της πράκτορεςΤο κιτ προσφέρει εργαλεία για μακροπρόθεσμη μνήμη, συστήματα δικαιωμάτων και συντονισμό υποπρακτόρων, διευκολύνοντας τη δημιουργία αυτοματοποιημένων λύσεων που συνεργάζονται για την επίτευξη κοινών στόχων και την ασφαλή συνδεσιμότητα με εργαλεία όπως WireGuard.

Ως συμπλήρωμα, Η εταιρεία ενεργοποιεί προσωρινά το «Imagine with Claude», μια επίδειξη που μας επιτρέπει να παρατηρήσουμε πώς λειτουργεί το μοντέλο παράγει λογισμικό σε πραγματικό χρόνο Δεν υπάρχει προκαθορισμένος κώδικας. Αυτή η προεπισκόπηση, διαθέσιμη για περιορισμένο χρονικό διάστημα σε χρήστες Max, καταδεικνύει τις δυνατότητες του μοντέλου για διαδραστική δημιουργία.

Ασφάλεια, ευθυγράμμιση και ανθεκτικότητα

Το Anthropic περιλαμβάνει το Sonnet 4.5 στο επίπεδο προστασίας του Επίπεδο ασφάλειας τεχνητής νοημοσύνης 3 (ASL-3), με φίλτρα εκπαιδευμένα να ανιχνεύουν επικίνδυνο περιεχόμενο, ειδικά εκείνο που σχετίζεται με ΧΒΡΠ κινδύνους. Η εταιρεία ισχυρίζεται ότι έχει μειώσει ψευδώς θετικά κατά δέκα φορές σε σύγκριση με την αρχική έκδοση αυτών των ταξινομητών και προσφέρει Συνέχεια συνομιλίας με το Sonnet 4 σε περίπτωση κλειδώματος ασφαλείας.

Παράλληλα, η εταιρεία διασφαλίζει ότι Το μοντέλο μειώνει ανεπιθύμητες συμπεριφορές όπως κολακεία ή παραπλανητικές απαντήσεις και ενισχύει την άμυνα ενάντια στις προσπάθειες έγκαιρη ένεσηΑυτά τα μέτρα υποδεικνύουν τη χρήση πιο αξιόπιστο σε εταιρικά περιβάλλοντα, όπου η εκτέλεση αυτοματοποιημένων ενεργειών απαιτεί ελέγχους και ιχνηλασιμότητα.

Αποκλειστικό περιεχόμενο - Κάντε κλικ εδώ  Η τεχνητή νοημοσύνη Gemini μπορεί πλέον να βρίσκει τραγούδια όπως το Shazam από το κινητό σας τηλέφωνο

Διαθεσιμότητα, πλατφόρμες και τιμές

Εικόνα από τον Claude Sonnet 4.5

Το Claude Sonnet 4.5 είναι διαθέσιμο στο Claude.ai (ιστός, iOS και Android) και για προγραμματιστές μέσω της πλατφόρμας προγραμματιστών Claude, με ενσωμάτωση σε υπηρεσίες όπως το Amazon Bedrock και το Google Cloud Vertex AI. Το δωρεάν πρόγραμμα λειτουργεί με όριο συνεδρίας που επαναφέρεται κάθε πέντε ώρες και μεταβλητό αριθμό μηνυμάτων κατ' απαίτηση. Οι τιμές παραμένουν οι ίδιες.: 3 δολάρια ανά εκατομμύριο διακριτικά εισόδου και 15 δολάρια ανά εκατομμύριο διακριτικά εξόδου.

Μεταξύ των νέων δυνατοτήτων πρόσβασης, Η επέκταση Chrome του Claude είναι διαθέσιμη στους χρήστες Max. προηγουμένως εγγεγραμμένο στη λίστα αναμονής. Παρόλο που τα benchmarks υποδηλώνουν σημαντικές βελτιώσεις σε σύγκριση με προηγούμενες εκδόσεις, το Anthropic σημειώνει ότι η πραγματική απόδοση εξαρτάται από την περίπτωση χρήσης και τον προϋπολογισμό συλλογισμού που έχει διαμορφωθεί για κάθε εργασία.

Με έναν συνδυασμό προόδων στον προγραμματισμό, μεγαλύτερης αυτονομίας για τους πράκτορες και αυστηρότερης εστίασης στην ασφάλεια, Το Claude Sonnet 4.5 τοποθετείται ως μια σταθερή επιλογή για τεχνικές ομάδες που χρειάζονται συνέχεια και έλεγχο σε μακρόχρονες διαδικασίες, διατηρώντας σταθερό κόστος και συμβατότητα με το ήδη αναπτυγμένο οικοσύστημα της Anthropic.

τεχνητή νοημοσύνη προσαρμογής LinkedIn
σχετικό άρθρο:
Το LinkedIn προσαρμόζει την Τεχνητή Νοημοσύνη του: αλλαγές απορρήτου, περιοχές και πώς να την απενεργοποιήσετε