- Κυκλοφόρησε το DeepSeek-V3.2-Exp, ένα ενδιάμεσο βήμα προς την επόμενη αρχιτεκτονική του
- Νέος μηχανισμός DeepSeek Sparse Attention για μεγάλα πλαίσια και χαμηλότερους υπολογισμούς
- Διαθέσιμο στην εφαρμογή, τον ιστό και το API με μείωση τιμής άνω του 50%.
- Ανταγωνιστική πίεση και προσαρμογή σε κινεζικά τσιπ, με υποστήριξη του FP8 και εργασία στο BF16
Χτισμένο σε V3.1-Τερματικό, το νέο μοντέλο DeepSeek V3.2-Exp εισάγει μια προσέγγιση διασποράς προσοχής η οποία επιδιώκει να μειώσει το υπολογιστικό φόρτο χωρίς να θυσιάσει την ποιότητα. Σύμφωνα με την εταιρεία, Οι τιμές των API μειώθηκαν κατά περισσότερο από 50% με άμεση ισχύκαι πρόσβαση Είναι πλέον διαθέσιμο στην εφαρμογή σας, στον ιστό και μέσω API, εκτός από το ότι προσφέρεται με τη μορφή ανοικτή πηγή σε πλατφόρμες ανάπτυξης όπως Αγκαλιάζοντας το πρόσωπο.
Τεχνικές καινοτομίες: διάσπαρτη προσοχή και μακροχρόνιο πλαίσιο

Η ουσία αυτής της ενημέρωσης είναι DeepSeek Αραιή Προσοχή (DSA), ένας μηχανισμός που ιεραρχεί τα σχετικά μέρη του πλαισίου για να τα επεξεργαστεί με μεγαλύτερη ακρίβεια. Η εταιρεία περιγράφει λεπτομερώς τη χρήση ενός Δείκτης αστραπής που επιλέγει βασικά τμήματα και μια διαδικασία «λεπτομερής επιλογή διακριτικών», με στόχο την κάλυψη μεγάλων παραθύρων περιβάλλοντος και τον χειρισμό πολλαπλών γραμμών σκέψης ταυτόχρονα με λιγότερη επιβάρυνση πληροφοριών.
Αυτή η προσέγγιση επιδιώκει βελτιώσεις τόσο στην εκπαίδευση όσο και στη συμπερασματική ανάλυση, επιταχύνοντας τους χρόνους και μειώνοντας την κατανάλωση μνήμης. Το DeepSeek υποδεικνύει ότι οι πιο πρόσφατες εκδόσεις του ήδη υποστήριξη του 8ου ΠΠ και εργάζονται πάνω στη συμβατότητα με BF16, μορφές αριθμών που βοηθούν στην ισορροπία ταχύτητας και ακρίβειας και διευκολύνουν την εκτέλεση σε τοπικό υλικό.
Η εταιρεία τονίζει ότι πρόκειται για μια κυκλοφορία, δηλαδή, μια έδαφος δοκιμών η οποία προβλέπει την αρχιτεκτονική επόμενης γενιάς. Παρόλα αυτά, η εσωτερικές δοκιμές Επισημαίνουν ότι η έκδοση V3.2-Exp (η πειραματική έκδοση) αποδίδει στο επίπεδο της έκδοσης V3.1-Terminus σε εργασίες όπως οι πράκτορες αναζήτησης, ο κώδικας ή τα μαθηματικά, με το πρόσθετο πλεονέκτημα της αποτελεσματικότητας σε σενάρια μακροχρόνιων συνθηκών.
Εκτός από το τεχνικό μέρος, η διαθεσιμότητα είναι ευρεία: το μοντέλο μπορεί να δοκιμαστεί στο app, ο ιστός και το API της εταιρείας. Το μείωση τιμής (πάνω από 50%) στοχεύει στην επιτάχυνση της υιοθέτησης από ομάδες προϊόντων και τμήματα μηχανικών που επιδιώκουν να μειώσουν το λειτουργικό κόστος.
Στο κοινοτικό επίπεδο, το άνοιγμα στο Αγκαλιάζοντας το πρόσωπο και το GitHub Δίνει τη δυνατότητα σε ερευνητές και προγραμματιστές να ελέγχουν, να επαναχρησιμοποιούν και να προτείνουν βελτιώσεις, ενισχύοντας το προφίλ του DeepSeek στο οικοσύστημα. Τεχνητή Νοημοσύνη ανοιχτού κώδικα.
Επιπτώσεις στην αγορά και γεωπολιτικός παλμός

Αν και αυτό το βήμα δεν αναμένεται να ταρακουνήσει τις αγορές όπως έγινε R1 και V3 στην αρχή του έτους, Το V3.2-Exp μπορεί να ασκήσει πίεση σε εγχώριους ανταγωνιστές όπως Κουέν (Αλιμπάμπα) και Αμερικανοί ανταγωνιστές όπως OpenAI, Ανθρώπινο ή xAI. Το κλειδί θα είναι να δείξουμε υψηλή απόδοση με χαμηλότερο κόστος, ένας ιδιαίτερα ευαίσθητος παράγοντας για μεγάλες αναπτύξεις Τεχνητής Νοημοσύνης.
Η κυκλοφορία πραγματοποιείται εν μέσω ενός περίπλοκου περιβάλλοντος: αρκετές χώρες έχουν περιορίσει τη χρήση του DeepSeek σε κυβερνητικές υπηρεσίες (συμπεριλαμβανομένων της Ιταλίας, των Ηνωμένων Πολιτειών και Corea del Sur), επικαλούμενος ανησυχίες για την ασφάλεια. Αυτοί οι περιορισμοί αναγκάζουν την εταιρεία να ενισχύσει την διακυβέρνηση και εγγυήσεις αν θέλετε να αποκτήσετε θεσμική παρουσία.
Στον βιομηχανικό τομέα, η Κίνα πιέζει τις εταιρείες τεχνολογίας της να μειώσουν την εξάρτησή τους από ξένους ημιαγωγούς. Έλεγχοι εξαγωγών τσιπ Nvidia από τις ΗΠΑ (όπως η Blackwell) και πρόσθετοι περιορισμοί—για παράδειγμα, σε RTX Pro 6000—, Η DeepSeek ισχυρίζεται ότι συνεργάζεται με Κινέζους κατασκευαστές τσιπ για τη βελτιστοποίηση της εκτέλεση σε τοπικό υλικόΣε αυτό το πλαίσιο, ο τομέας έχει δηλώσει την υποστήριξη του Huawei στην τελευταία ενημέρωση μοντέλου.
Αν το μοντέλο καταφέρει να διατηρήσει την απόδοσή του με το μισό λειτουργικό κόστος, περιπτώσεις χρήσης με μεγάλα έγγραφα, οι μακροσκελείς συνομιλίες ή οι απαιτητικές αναλυτικές εργασίες θα μπορούσαν να ωφελήσουν ιδιαίτερα. Για πολλές εταιρείες, ο συνδυασμός αποδοτικότητα + τιμή Είναι τόσο καθοριστικό όσο μερικοί επιπλέον βαθμοί σε σημεία αναφοράς.
Η προσέγγιση της DeepSeek συνδυάζει την ανοιχτότητα, την αποτελεσματικότητα και την άμεση διαθεσιμότητα με έναν οδικό χάρτη που υπόσχεται μια πιο ικανή αρχιτεκτονική. Εάν η εταιρεία ενοποιήσει τις μειώσεις κόστους διατηρώντας παράλληλα το επίπεδο που επιδεικνύεται από το V3.1-Terminus, Το νέο μοντέλο θα μπορούσε να αποτελέσει πρακτικό σημείο αναφοράς για την ανάπτυξη της γενετικής τεχνητής νοημοσύνης σε κλίμακα χωρίς ραγδαία κόστη.Θα δούμε αν το DeepSeek μπορεί να κάνει την αποτελεσματικότητα να μην είναι πλέον τεχνική επιδίωξη, αλλά ένα πραγματικό ανταγωνιστικό πλεονέκτημα για τις εταιρείες και τους προγραμματιστές.
Είμαι λάτρης της τεχνολογίας που έχει μετατρέψει τα «γκικ» ενδιαφέροντά του σε επάγγελμα. Έχω περάσει περισσότερα από 10 χρόνια της ζωής μου χρησιμοποιώντας τεχνολογία αιχμής και ασχολούμαι με όλα τα είδη προγραμμάτων από καθαρή περιέργεια. Τώρα έχω ειδικευτεί στην τεχνολογία υπολογιστών και στα βιντεοπαιχνίδια. Αυτό οφείλεται στο γεγονός ότι για περισσότερα από 5 χρόνια εργάζομαι γράφοντας για διάφορους ιστότοπους σχετικά με την τεχνολογία και τα βιντεοπαιχνίδια, δημιουργώντας άρθρα που επιδιώκουν να σας δώσουν τις πληροφορίες που χρειάζεστε σε μια γλώσσα κατανοητή από όλους.
Αν έχετε απορίες, οι γνώσεις μου κυμαίνονται από οτιδήποτε σχετίζεται με το λειτουργικό σύστημα Windows καθώς και με Android για κινητά τηλέφωνα. Και η δέσμευσή μου είναι απέναντί σας, είμαι πάντα πρόθυμος να αφιερώσω λίγα λεπτά και να σας βοηθήσω να επιλύσετε τυχόν απορίες που μπορεί να έχετε σε αυτόν τον κόσμο του Διαδικτύου.