Η Lexar μεταφέρει τα τοπικά AI μοντέλα από τη DRAM στον SSD
Το πρόβλημα: η DRAM είναι ακριβή και δεν φτάνει
Καθώς η υπολογιστική ισχύς για AI μεταφέρεται ραγδαία από το νέφος στο «άκρο» του δικτύου, συσκευές όπως AI PC, έξυπνα οχήματα και ρομποτικά συστήματα αντιμετωπίζουν αυξανόμενες προκλήσεις αποθήκευσης: ανάγκες πραγματικού χρόνου για απόδοση δεδομένων πολλαπλών τύπων, ακραία τυχαία φορτία I/O και ανάγκες αξιοπιστίας περιβάλλοντος. Σε αυτό το πλαίσιο, η Lexar τοποθετεί τον AI Storage Core SSD ως απάντηση στο πρόβλημα κόστους και χωρητικότητας της DRAM.
Σύμφωνα με τον Guo, η DRAM κοστίζει περίπου έξι φορές περισσότερο να κατασκευαστεί σε σύγκριση με τη NAND Flash — κι αυτό δημιουργεί ευκαιρίες για SSDs με AI-ειδικές βελτιστοποιήσεις, ώστε να μειωθεί η ανάγκη σε DRAM για την εκτέλεση μοντέλων τοπικά. Σύμφωνα με εκτιμήσεις της Gartner, οι αποστολές AI PC θα φτάσουν τα 143 εκατομμύρια μονάδες το 2026, αντιπροσωπεύοντας περισσότερο από το μισό της παγκόσμιας αγοράς PC.
Το AI Storage Core SSD: τι κάνει διαφορετικά
Πρόκειται για έναν υψηλής ταχύτητας SSD βελτιστοποιημένο για λειτουργίες I/O μικρών μπλοκ (512 bytes), ο οποίος αλληλεπιδρά με το σύστημα σε επίπεδο SLC Boost και Read Cache, βελτιώνοντας τη φόρτωση μεγάλων γλωσσικών μοντέλων (LLM), ροών παραγωγής εικόνας και άλλων AI εργασιών πραγματικού χρόνου. Η Lexar παρουσίασε τον AI Storage Core με χωρητικότητα έως 4 TB, υψηλές επιδόσεις και σχεδίασμα hot-swappable για AI-enabled συσκευές «άκρου».
Η αρχιτεκτονική του συστήματος περιλαμβάνει, σύμφωνα με το TechPowerUp, τόσο υλικό (hardware) όσο και λογισμικό (software). Αποτελείται από τον Lexar AI Storage Core SSD, ένα AI Storage Core Stick και έναν δέκτη PCIe Gen 4, ο οποίος προσεγγίζει την αποθήκευση με έναν ολοκαίνουργιο, πολύ ταχύτερο τρόπο.
Τα νούμερα: Qwen 122B με 32 GB DRAM
Σε εσωτερικές δοκιμές της Lexar, το σύστημα κατάφερε να εκτελέσει το μοντέλο Qwen 3.5 122B παραμέτρων σε τοπικό PC. Παραδοσιακά, ένα τέτοιο μοντέλο απαιτούσε σύστημα με 128 GB DRAM, κοστολογημένο περίπου στα 4.500 δολάρια. Με την τεχνολογία της Lexar, η απαίτηση σε DRAM μειώνεται στα 32 GB — μείωση αποτυπώματος μνήμης τουλάχιστον 40% σε σχέση με τις παραδοσιακές λύσεις.
Ωστόσο, η αλλαγή αυτή έρχεται με συγκεκριμένα trade-offs. Σε αυτή τη διαμόρφωση, το μοντέλο εκτελείται στις 35 δισεκατομμύρια παραμέτρους (και όχι στις 122B), αποδίδοντας — πάντα σύμφωνα με εσωτερικά δεδομένα της Lexar — 15,6 tokens ανά δευτερόλεπτο έναντι 5,2 tokens/s με τις παραδοσιακές μεθόδους. Για λόγους σύγκρισης, αν το πλήρες 122B μοντέλο φορτωθεί σε 32 GB DRAM χωρίς τη λύση της Lexar, το δημοφιλές Llama.cpp αποτυγχάνει παντελώς και κρασάρει. Με τη μεταφορά φορτίου (offloading) στον SSD της Lexar, το ίδιο μοντέλο αποδίδει περίπου 4,4 tokens/s — χαμηλότερα, αλλά λειτουργικά.
Επιφυλάξεις και διαθεσιμότητα
Όλα τα νούμερα επιδόσεων προέρχονται αποκλειστικά από εσωτερικές δοκιμές και επίδειξη (demo) της Lexar — δεν έχουν επαληθευτεί από ανεξάρτητους αναλυτές. Επίσης, η σύγκριση στα 35B παραμέτρων (και όχι στα 122B) αξίζει να τονιστεί: η λύση της Lexar δεν τρέχει ολόκληρο το μοντέλο στις ονομαστικές παραμέτρους του, αλλά ένα «κλιμακωμένο» υποσύνολο, με σαφές όφελος σε τιμή/μνήμη αλλά και αντίκτυπο στην ποιότητα εξόδου που δεν έχει δημοσιευτεί.
Η Lexar μεταβαίνει από αγώνες ταχύτητας αποθήκευσης σε προϊόντα ρητά προσαρμοσμένα για εκτέλεση μοντέλων στη συσκευή — αν και ορισμένοι ισχυρισμοί παραμένουν σε εννοιολογικό ή υψηλό επίπεδο. Προς το παρόν, δεν υπάρχει επίσημη ημερομηνία γενικής κυκλοφορίας (GA) για τον AI Storage Core SSD σε καταναλωτικό επίπεδο, ούτε δημόσια τιμολόγηση.
Πηγές
TechPowerUp – Lexar Wants to Offload Local AI Models to SSD Amid the RAMpocalypse Lexar Global – AI Storage Core Official Announcement StorageNewsletter – Lexar Unveils AI Storage Core (Δεκέμβριος 2025)
202
