Jump to content
  • astrolabos
    astrolabos

    Η DeepSeek καθυστερεί το επόμενο AI μοντέλο της λόγω χαμηλής απόδοσης κινεζικών τσιπ

    Η DeepSeek ανέβαλε την κυκλοφορία του επόμενου μεγάλου μοντέλου τεχνητής νοημοσύνης, καθώς οι εσωτερικές δοκιμές με επιταχυντές και επεξεργαστές της Huawei, απέδωσαν αποτελέσματα κατώτερα του αναμενομένου σε ταχύτητα εκπαίδευσης και σε απόδοση στο inference, σε σχέση με προηγούμενες υλοποιήσεις που αξιοποιούσαν αμερικανικό hardware υψηλής απόδοσης. Η καθυστέρηση συνδέεται επίσης ευθέως με τους περιορισμούς εξαγωγών προηγμένων GPU προς την Κίνα, οι οποίοι ωθούν την εταιρεία στη χρήση ηπιότερων, εγχώριων εναλλακτικών, με λιγότερο ώριμο οικοσύστημα λογισμικού και χαμηλότερη ενεργειακή αποδοτικότητα και υπολογιστική ισχύ.

     

    Σε τεχνικό επίπεδο, ο συνδυασμός μειωμένου εύρους ζώνης μνήμης (memory bandwidth), μειωμένης αποτελεσματικής ταυτόχρονης εκτέλεσης εργασιών και λιγότερο βελτιστοποιημένων βιβλιοθηκών για την εκπαίδευση μεγάλων μοντέλων περιορίζει την κλιμάκωση σε κλίμακες εκατοντάδων δισ. παραμέτρων και αυξάνει τον χρόνο σύγκλισης. Αυτό μεταφράζεται σε υψηλότερο πραγματικό κόστος εκπαίδευσης (λόγω παρατεταμένων κύκλων) και, κυρίως, σε χαμηλότερο περιθώριο (headroom) για τη λανθάνουσα καθυστέρηση του inference και το μήκος συμφραζομένων (context length), με άμεσες επιπτώσεις στην εμπειρία λογικής/αιτιολόγησης που η DeepSeek έχει προτάξει ως ανταγωνιστικό πλεονέκτημα.

     

    Στρατηγικά, η εταιρεία φαίνεται να σταθμίζει τρεις οδούς: περαιτέρω βελτιστοποίηση λογισμικού στα διαθέσιμα κινεζικά τσιπ (compilers, kernels, προγραμματισμός sparsity/MoE)· υβριδικές αρχιτεκτονικές εκπαίδευσης με μικτά clusters και επιθετικό pruning/quantization· ή αναθεώρηση του χρονοδιαγράμματος έως ότου διασφαλιστούν επαρκείς παρτίδες προηγμένων επιταχυντών. Κάθε επιλογή συνεπάγεται συμβιβασμούς μεταξύ κόστους, απόδοσης και διακινδύνευσης κανονιστικής συμμόρφωσης.

     

    Η αναβολή υπογραμμίζει ότι το πλεονέκτημα κόστους/απόδοσης της DeepSeek εξαρτάται όχι μόνο από την αλγοριθμική καινοτομία αλλά και από την πρόσβαση σε ώριμη υπολογιστική υποδομή. Αν οι βελτιστοποιήσεις στο εγχώριο hardware γεφυρώσουν το κενό, το σχέδιο μπορεί να επανέλθει ταχύτερα· διαφορετικά, η ποιότητα και ο ρυθμός κυκλοφορίας νέων μοντέλων θα παραμείνουν ευάλωτα στη γεωπολιτική και στην υστέρηση του οικοσυστήματος των τσιπ.


    Πηγή
×
×
  • Δημιουργία...

Important Information

Ο ιστότοπος theLab.gr χρησιμοποιεί cookies για να διασφαλίσει την καλύτερη εμπειρία σας κατά την περιήγηση. Μπορείτε να προσαρμόσετε τις ρυθμίσεις των cookies σας , διαφορετικά θα υποθέσουμε ότι είστε εντάξει για να συνεχίσετε.