Ο νέος AI επεξεργαστής της Nvidia φέρεται να είναι 4,5 φορές ταχύτερο από τον προηγούμενο
Οι δείκτες αναφοράς MPerf (τεχνικά αποκαλούμενοι "MLPerfTM Inference 2.1") μετρούν τους φόρτους εργασίας "συμπερασμάτων", οι οποίοι δείχνουν πόσο καλά ένας επεξεργαστής μπορεί να εφαρμόσει ένα μοντέλο μηχανικής εκμάθησης που έχει εκπαιδευτεί προηγουμένως σε νέα δεδομένα. Μια ομάδα εταιρειών του κλάδου γνωστή ως MLCommons ανέπτυξε τα MLPerf benchmarks το 2018 για να προσφέρει μια τυποποιημένη μέτρηση για τη μετάδοση της απόδοσης μηχανικής μάθησης σε δυνητικούς πελάτες. Συγκεκριμένα, το H100 τα πήγε καλά στο benchmark BERT-Large, το οποίο μετρά την απόδοση επεξεργασίας φυσικής γλώσσας χρησιμοποιώντας το μοντέλο BERT που αναπτύχθηκε από την Google. Η Nvidia πιστώνει αυτό το συγκεκριμένο αποτέλεσμα στο Transformer Engine της αρχιτεκτονικής Hopper, που επιταχύνει συγκεκριμένα μοντέλα μετασχηματιστών εκπαίδευσης. Αυτό σημαίνει ότι το H100 θα μπορούσε να επιταχύνει μελλοντικά μοντέλα φυσικής γλώσσας παρόμοια με το GPT-3 του OpenAI, το οποίο μπορεί να συνθέτει γραπτά έργα σε πολλά διαφορετικά στυλ και να πραγματοποιεί συνομιλίες.
Το τσιπ, το οποίο βρίσκεται ακόμη σε εξέλιξη, προβλέπεται να αντικαταστήσει το A100 ως την κορυφαία GPU του κέντρου δεδομένων της εταιρείας. Η κυβέρνηση των ΗΠΑ επέβαλε περιορισμούς την περασμένη εβδομάδα στις εξαγωγές των τσιπ στην Κίνα, με αποτέλεσμα πολλοί να φοβούνται ότι η Nvidia ενδέχεται να μην είναι σε θέση να παραδώσει το H100 μέχρι το τέλος του έτους. Ωστόσο, η Nvidia διευκρίνισε ότι η κυβέρνηση των ΗΠΑ θα της επιτρέψει να συνεχίσει την ανάπτυξη του τσιπ στην Κίνα, «έτσι το έργο εμφανίζεται ξανά σε τροχιά προς το παρόν».
676
