Για πρώτη φορά, ερευνητές του Πανεπιστημίου του Τορόντο κατάφεραν να εκτελέσουν επιτυχημένη Rowhammer επίθεση σε κάρτα γραφικών NVIDIA RTX A6000 με μνήμη GDDR6, αποδεικνύοντας ότι το γνωστό hardware bug των DRAM μπορεί να εκμεταλλευτεί και σε GPU, όχι μόνο σε CPU. Η επίθεση εκτελέστηκε με απενεργοποιημένο το ECC (Error Correcting Code) και προκάλεσε αλλοίωση δεδομένων (bit flips) στη μνήμη της κάρτας, οδηγώντας ακόμη και σε καταστροφή της ακρίβειας μοντέλων τεχνητής νοημοσύνης (AI), από 80% σε λιγότερο από 1%.
Πώς λειτουργεί το Rowhammer
Το Rowhammer είναι ένα φυσικό φαινόμενο των DRAM, όπου η επαναλαμβανόμενη πρόσβαση σε μια σειρά μνήμης προκαλεί ηλεκτρική παρεμβολή σε γειτονικές σειρές, οδηγώντας σε τυχαίες αλλαγές bit (bit flips). Μέχρι σήμερα, οι επιθέσεις Rowhammer είχαν αποδειχθεί κυρίως σε DDR4 μνήμες συστημάτων CPU. Η νέα έρευνα αποδεικνύει ότι και οι GDDR6 μνήμες των GPU είναι ευάλωτες, ειδικά όταν δεν έχει ενεργοποιηθεί το ECC.
Ποιες κάρτες και συστήματα επηρεάζονται
Η NVIDIA επιβεβαιώνει ότι η ευπάθεια αφορά κυρίως επαγγελματικές και data center GPUs με GDDR6, όπως τις σειρές RTX A6000, A100, H100, RTX 6000, αλλά και DGX, HGX, Jetson, καθώς και τις σειρές Blackwell, Hopper και Ada. Οι καταναλωτικές gaming κάρτες δεν αποτελούν άμεσο στόχο, ωστόσο η εταιρεία εστιάζει στην προστασία επαγγελματικών και πολυ-χρηστικών περιβαλλόντων (multi-tenant cloud, virtual desktops), όπου ο κίνδυνος είναι αυξημένος αν το ECC είναι απενεργοποιημένο.
Πώς αντιμετωπίζεται – Η σημασία του ECC
Η ενεργοποίηση του ECC (Error Correcting Code) σε επίπεδο συστήματος είναι η μοναδική αξιόπιστη άμυνα κατά του Rowhammer στη μνήμη GPU. Η έρευνα έδειξε ότι όταν το ECC ήταν ενεργό, η επίθεση απέτυχε πλήρως. Η NVIDIA συνιστά στους διαχειριστές να ελέγχουν αν το ECC είναι ενεργό, χρησιμοποιώντας εργαλεία όπως το nvidia-smi ή τα BMC/Redfish APIs σε enterprise setups. Σε νεότερες κάρτες με GDDR7 ή HBM3, το On-Die ECC είναι ενσωματωμένο και δεν μπορεί να απενεργοποιηθεί.
Επιπτώσεις και πρακτικές οδηγίες
Η επίθεση Rowhammer μπορεί να οδηγήσει σε:
-
Αλλοίωση δεδομένων σε AI/ML workloads, με καταστροφικές συνέπειες για την ακρίβεια μοντέλων.
-
Πιθανή κλιμάκωση προνομίων ή διαρροή δεδομένων σε multi-tenant περιβάλλοντα.
-
Απώλεια αξιοπιστίας σε επιστημονικούς υπολογισμούς και data center εφαρμογές.
Η NVIDIA δεν εκδίδει νέο patch ή firmware, αλλά υπενθυμίζει ότι η προστασία υπάρχει ήδη μέσω ECC – αρκεί να είναι ενεργοποιημένη. Οι διαχειριστές συστημάτων οφείλουν να ελέγξουν άμεσα τις ρυθμίσεις τους, ειδικά σε περιβάλλοντα cloud ή virtual desktops, όπου πολλοί χρήστες έχουν ταυτόχρονη πρόσβαση στη GPU.
Εν Κατακλείδι
Η εμφάνιση του Rowhammer σε GPU μνήμη αποτελεί σημαντικό ορόσημο στην ασφάλεια των υπολογιστικών συστημάτων, καθώς διευρύνει το πεδίο εφαρμογής ενός από τα πιο διαβόητα hardware bugs της τελευταίας δεκαετίας. Η ενεργοποίηση του ECC είναι πλέον απαραίτητη για κάθε επαγγελματική ή data center εγκατάσταση που βασίζεται σε NVIDIA GPUs με GDDR6, ενώ οι υπεύθυνοι IT πρέπει να επανεξετάσουν άμεσα τις πολιτικές ασφάλειας και τα εργαλεία παρακολούθησης των συστημάτων τους. Η υπόθεση αυτή αποδεικνύει ότι η ασφάλεια στο hardware δεν είναι ποτέ δεδομένη και ότι η σωστή παραμετροποίηση μπορεί να κάνει τη διαφορά ανάμεσα σε ένα ασφαλές και ένα ευάλωτο υπολογιστικό περιβάλλον.
Recommended Comments
Create an account or sign in to comment
You need to be a member in order to leave a comment
Create an account
Sign up for a new account in our community. It's easy!
Register a new accountSign in
Already have an account? Sign in here.
Sign In Now