Jump to content



The Book of Bulldozer - Fix για επιδόσεις by "The Stilt"


felix

Recommended Posts

Μιας και δεν το είδα στο φόρουμ μας κάπου, είπα να το κάνω σε νέο θέμα για να μείνει.

Απευθύνεται σε όλους τους κατόχους των παρακάτω :

AMD Barracuda (Zambesi, Vishera), AMD Comal (Trinity, Richland), AMD Virgo (Trinity, Richland)

Τί κάνει το fix ?

Βελτιώνει σημαντικά τις επιδόσεις των παραπάνω σε προγράμματα που χρησιμοποιούν x87 instruction set (π.χ. SuperPi)

Πώς προέκυψε το fix :

Οι χαμηλές επιδόσεις αποδίδονται σε σφάλμα που διαπίστωσε ο Φινλανδός "The Stilt" και κατόπιν δημιούργησε το fix, συγκεκριμένα ο ίδιος περιγράφει το story :

The caches on 15h family have higher latency than 10h family for example, and SuperPI happens to love large & low latency caches.

15h family was initially designed for high frequencies. Just like the F1 engines, they produce no power at low revs. And unfortunately it currently doesn't seem to be possible to build an engine capable reving high enough. We might discuss more about the caches in "Episode 3"... If possible.

Agner Fog from Copenhagen University College of Engineering has made an excellent document about the instruction latencies of the modern CPUs.

Values for 10h family start from page 26, while 15h family values are located at page 36.

Anyway...

Few days when I was doing some low level testing for other purposes, I found something that didn't make any sense to me.

Now I roughly know what it is and what it does, but still some questions remain: Why does this "feature" exist in the first place and why it is activated on all 15h family parts.

I would normally assume it is a workaround for some errata, however no bulletin exists for this one either.

Also this feature does not exist in any documentation, or it does but only AMD has access to the required level.

I find it hard to believe that it would be a design issue as the affected instructions work fine (but slowly) and it existed since early Zambesi revisions and, currently is still present in Richland and probably beyond (within family 15h)...

I'd say it is either a errata fix or a errata fix gone wrong.

If it is a programming mistake which has gone un-noticed during the last two years...

That would make me just sad

Το link από το αντίστοιχο θέμα του XtremeSystems που δημοσιεύτηκε το fix --> The Book of Bulldozer - Revelations: Episode 2 (SuperPI / x87)

Εκεί θα βρείτε όλες τις λεπτομέρειες και το download link.

Προφανώς το παραπάνω αποτελεί μία σύντομη περιγραφή της εκπληκτικής δουλειάς που έχει κάνει ο Stilt και όλα τα credits ανήκουν σε αυτόν. Εγώ απλά το είδα και είπα να το μοιραστώ.

Δικό σας ! (μπουζούκια-style)

P.S. : Πρίν το χρησιμοποιήσετε , καλό θα ήταν να κάνετε και μία δοκιμή άνευ (π.χ.SuperPi) , ώστε να υπάρχει μέτρο σύγκρισης όταν θα εγκατασταθεί το fix μετά. Μερικά screenshots για σύγκριση πρίν-μετά θα ήταν καλή ιδέα....

Link to comment
Share on other sites

ειχα παιξει πιο παλια spi 1m και 32m με το patch του stilt αλλα δε θυμαμαι αν ποσταρα αποτελεσματα τα οποια ειναι αρκετα βελτιωμενα αλλα οχι οσο θα ηθελα πραγματικα (σε σχεση παντα με intel) !!

σκρινακι απο το patch

g3zt.jpg

spi 1m χωρις το patch στα 4.5

tytf.jpg

spi 1m στα 4.5 μετα το patch

wu2x.jpg

συνεχεια παμε να δουμε το spi 32m

εδω ενα παλιοτερο run στα 5209 χωρις το patch!!

btcr.jpg

και εδω αποφασισα να τρεξω spi 32m στα 4.5 αλλα με το patch!

για να κανω μια κοντρα εσωτερικη (5209 vs 4500) (τα νουμερα μιλανε μονα τους) !!

2re0.jpg

Link to comment
Share on other sites

ειχα παιξει πιο παλια spi 1m και 32m με το patch του stilt αλλα δε θυμαμαι αν ποσταρα αποτελεσματα τα οποια ειναι αρκετα βελτιωμενα αλλα οχι οσο θα ηθελα πραγματικα (σε σχεση παντα με intel) !!

σκρινακι απο το patch

3μιση λεπτά κάτω το 32Μ και με 700Μhz λιγότερα....σημαντική βελτίωση...

Link to comment
Share on other sites

Archived

This topic is now archived and is closed to further replies.

×
×
  • Δημιουργία...

Important Information

Ο ιστότοπος theLab.gr χρησιμοποιεί cookies για να διασφαλίσει την καλύτερη εμπειρία σας κατά την περιήγηση. Μπορείτε να προσαρμόσετε τις ρυθμίσεις των cookies σας , διαφορετικά θα υποθέσουμε ότι είστε εντάξει για να συνεχίσετε.