- Η Qualcomm παρουσίασε στο Investor Day της 24ης Ιουνίου 2026 την αρχιτεκτονική HBC (High Bandwidth Compute), η οποία τοποθετεί τον επιταχυντή AI κάτω από στοίβα μνήμης LPDDR μέσω TSV, αποφεύγοντας το ακριβό silicon interposer της HBM.
- Το AI250 με HBC Gen 1 στοχεύει σε 133 TB/s εύρος ζώνης ανά κάρτα — 18x περισσότερο από το AI200 με LPDDR5X — ενώ το AI350 με HBC Gen 2 υπόσχεται 54x βελτίωση έναντι του AI200.
- Όλοι οι αριθμοί προέρχονται από την ίδια την Qualcomm και δεν έχουν επαληθευτεί ανεξάρτητα· το εμπορικό sampling του AI250 αναμένεται μέσα 2027, του AI350 το 2028.
Στο Investor Day της 24ης Ιουνίου 2026, η Qualcomm αποκάλυψε την αρχιτεκτονική High Bandwidth Compute (HBC), έναν near-memory επιταχυντή τρισδιάστατης στοίβας, που τοποθετεί τον υπολογιστικό πυρήνα κάτω από στοίβα μνήμης LPDDR. Το λεγόμενο «τείχος μνήμης» (memory wall) αποτελεί έναν από τους κύριους περιορισμούς επιδόσεων για πολλά φορτία εργασίας AI, και η μνήμη υψηλού εύρους ζώνης (HBM) δεν αποτελεί πάντα τη λύση, καθώς η υπολογιστική ισχύς αναπτύσσεται ταχύτερα από το εύρος ζώνης μνήμης.
Τι είναι η αρχιτεκτονική HBC και πώς λειτουργεί
Η προσέγγιση της Qualcomm στο near-memory compute είναι ξεκάθαρη: η εταιρεία αποσυνδέει τον επιταχυντή AI από το SoC και τον τοποθετεί κάτω από τη στοίβα μνήμης LPDDR DRAM. Ο επιταχυντής HBC συνδέεται με τη στοίβα LPDDR μέσω through-silicon vias (TSV) για να παρέχει μέγιστο εύρος ζώνης και χωρητικότητα χωρίς τη χρήση της ακριβής μνήμης HBM και της σύνθετης προηγμένης συσκευασίας (advanced packaging).
Η Qualcomm δεν αποκαλύπτει το πραγματικό εύρος ζώνης που παρέχει το HBC, αλλά ισχυρίζεται ότι προσφέρει 6x υψηλότερη αποδοτικότητα εύρους ζώνης ανά watt σε σύγκριση με HBM και άνω των 200x χωρητικότητα σε σύγκριση με on-chip SRAM. Σημαντική επισήμανση: σύμφωνα με την επίσημη ανακοίνωση της Qualcomm, οι συγκρίσεις αυτές είναι κανονικοποιημένες σε επίπεδο κάρτας (card-level) για τη σύγκριση με HBM και σε επίπεδο rack για τη σύγκριση με SRAM, βάσει δημοσιευμένων προδιαγραφών ανταγωνιστικών προϊόντων. Πρόκειται, με άλλα λόγια, για εταιρικά claims που δεν έχουν επαληθευτεί ανεξάρτητα.
Σύμφωνα με την Qualcomm, η αξία για τον κλάδο είναι χαμηλότερη κατανάλωση ενέργειας, λιγότερη θερμότητα και η εξάλειψη του ακριβού silicon interposer που απαιτούν οι λύσεις HBM. Επίσης, δίνεται η δυνατότητα ανάπτυξης πολλαπλών στοιβών HBC σε ένα μοναδικό υπολογιστικό στοιχείο με τυπική συσκευασία, κάτι που αποδίδει σημαντικό πλεονέκτημα επιδόσεων ανά κόστος.
AI250: HBC Gen 1 και οι επιδόσεις-στόχος
Στην πρώτη γενιά (HBC Gen 1), η λύση θα υλοποιηθεί στον επιταχυντή AI250, στον οποίο η ενισχυμένη με HBC στοίβα LPDDR θα βρίσκεται στο ίδιο οργανικό υπόστρωμα 2D. Κάθε κάρτα AI250 στοχεύει σε 133 TB/s εύρος ζώνης, αύξηση 18x σε σχέση με το AI200 που χρησιμοποιεί LPDDR5X.
Ο προκάτοχος AI200, που αναμένεται αργότερα εντός του 2026, θα βασίζεται σε LPDDR5X και θα προσφέρει 43 TB RAM ανά rack. Και οι δύο επιταχυντές, AI200 και AI250, βασίζονται στις μονάδες επεξεργασίας νευρωνικών δικτύων Hexagon (NPU) της Qualcomm, προσαρμοσμένες για φορτία εργασίας AI σε κέντρα δεδομένων.
Το εμπορικό sampling του HBC Gen 1 με το AI250 αναμένεται να ξεκινήσει στα μέσα του 2027. Σε αυτό το στάδιο, δεν υπάρχουν ανεξάρτητες μετρήσεις επιδόσεων. Ανεξάρτητες μετρήσεις επιδόσεων έναντι επιταχυντών βασισμένων σε HBM και μετρήσεις ισχύος ανά μονάδα κειμένου (token) από πελάτες ή τρίτους θα καθορίσουν αν το διεκδικούμενο πλεονέκτημα των 6x εύρους ζώνης ανά watt επιβεβαιώνεται σε πραγματικά φορτία εργασίας παραγωγής.
Ο χάρτης πορείας: AI350 με HBC Gen 2 το 2028
Η Qualcomm εργάζεται παράλληλα σε μια εκτεταμένη δεύτερη γενιά HBC Gen 2, που θα συνοδεύεται από τον επιταχυντή AI350 το 2028, και θα προσφέρει έως 54x επιτάχυνση σε πραγματικό εύρος ζώνης έναντι του AI200. Ο AI350 σχεδιάζεται για rack ψύξης αέρα και άμεσης υγρής ψύξης (direct liquid cooling) και υπόσχεται 4x–8x καλύτερες επιδόσεις ανά watt σε σύγκριση με υφιστάμενες αρχιτεκτονικές GPU ως προς το εύρος ζώνης μνήμης ανά watt ανά κάρτα. Και αυτά τα νούμερα αποτελούν εταιρικές εκτιμήσεις, όχι ανεξάρτητα επιβεβαιωμένα στοιχεία.
Για τη διασύνδεση, ο AI350 υποστηρίζει scale-up μέσω UALink (Ultra Accelerator Link) και ESUN (Ethernet for Scale-Up Networking), καθώς και scale-out μέσω copper και optical διασυνδέσεων.
Dragonfly C1000 CPU και ευρύτερο χαρτοφυλάκιο
Στο Investor Day, η Qualcomm παρουσίασε παράλληλα τον Dragonfly C1000 CPU, σε συνδυασμό με προϊόντα συνδεσιμότητας και λύσεις custom silicon, με στόχο τη μεγιστοποίηση των επιδόσεων ανά watt και της ρυθμαπόδοσης παραγωγής μονάδων κειμένου (tokens) σε χαμηλότερο συνολικό κόστος ιδιοκτησίας (TCO). Ο C1000 διαθέτει chiplet σχεδιασμό με άνω των 250 πυρήνων και στοχεύει σε διπλάσιες τουλάχιστον επιδόσεις ανά watt σε σύγκριση με υφιστάμενους server CPU.
Σύμφωνα με Reuters, η Microsoft και η Meta θα χρησιμοποιήσουν τα νέα AI chips της Qualcomm, ενώ ο CFO Akash Palkhiwala προβλέπει έσοδα 15 δισ. δολαρίων από chip κέντρων δεδομένων έως το 2029 και 5 δισ. δολαρίων στο οικονομικό έτος 2027. Η Qualcomm ανέφερε επίσης ευρεία υποστήριξη από άνω των 35 εταιρειών-εταίρων σε διαφορετικά τεχνολογικά οικοσυστήματα.

TheLab Weekly Digest
Recommended Comments
There are no comments to display.
Create an account or sign in to comment
You need to be a member in order to leave a comment
Create an account
Sign up for a new account in our community. It's easy!
Register a new accountSign in
Already have an account? Sign in here.
Sign In Now