Jump to content



The Book of Bulldozer - Revelations: Episode 2 (SuperPI / x87) by Stilt


TASOS

Recommended Posts

AMD Bulldozer fans ... κάτοχοι (Zambesi, Vishera,Trinity, Richland).

A must read !

http://www.xtremesystems.org/forums/showthread.php?286448-The-Book-of-Bulldozer-Revelations-Episode-2-(SuperPI-x87)

Αν επαληθευτούν αυτά που γράφει ο "stilt" ... τότε δέν ξέρω τι να πώ για τους engineers της AMD.

Link to comment
Share on other sites

Ε εντάξει θα κουφαθούμε αν βγει κανένα τρελό patch όχι από την AMD, αλλά από κάποιον τρίτο. Η όλη φάση μπορεί να εξελιχθεί από ένα απλό λάθος εκτίμησης, μέχρι και σε θεωρίες συνωμοσίας.

Link to comment
Share on other sites

Επειδή έχω να ασχοληθώ με SPi από τότε που ο όπτερον 144 ήταν ο κορυφαίος επεξεργαστής , τα νούμερα που έβγαλε ο τύπος με το mod, πόσο καλύτερα ήταν σε σχέση με μη μονταρισμένο επεξεργαστή?

Link to comment
Share on other sites

Επειδή έχω να ασχοληθώ με SPi από τότε που ο όπτερον 144 ήταν ο κορυφαίος επεξεργαστής , τα νούμερα που έβγαλε ο τύπος με το mod, πόσο καλύτερα ήταν σε σχέση με μη μονταρισμένο επεξεργαστή?

Γράφει στο κείμενο του ο stilt.

After the fix has been applied SuperPI shows 18-30% improvement in performance.

Bigger the calculation, bigger the improvement.

Link to comment
Share on other sites

εκτος απο το πι, πουθενα αλλου υπαρχει κερδος ή τσαμπα η φασαρια?

Ετσι όπως έχει διατυπωθεί , αφορά παλιές εφαρμογές και προγράμματα ...

Effect: A massive performance hit in application heavily utilizing x87 instructions.

Link to comment
Share on other sites

Εχουμε νεότερα !!!

http://www.xtremesystems.org/forums/showthread.php?286448-The-Book-of-Bulldozer-Revelations-Episode-2-%28SuperPI-x87%29&p=5194507&viewfull=1#post5194507

There are two kind of news bad and good ones.

Let's get rid of the bad ones first:

Originally I tested this fix on three different CPU/APUs (Richland, Trinity and Vishera).

When I went to verify the effects of the fix on Zambezi the system crashed immediately once the necessary changes were written.

After some research I noticed that these registers do not respond on Zambezi based CPUs.

Upon reading all of them return null values and crash the system unless a special method is used.

At first it appeared that these registers do not exist on Zambezi, however after digging a bit deeper I found indication that the registers are there... But for some reason AMD seem to have protected them with a ESI/EDI password on Zambezi.

They do not require any passwords on any Piledriver based APU/CPU.

So the fix will not be available for Zambezi users.

Sorry for the massive let-down frown.gif

The the good news:

The software is pretty much finished.

It should be available for download within this week.

After the let-down on Zambezi I felt that something had to be done for Zambezi too.

While it does not result as massive boost as the original fix does it still gives something:

SuperPI 1M: > 1 second improvement

SuperPI 8M: > 10 second improvement

SuperPI 32M: > 35 second improvement

It is called as "Zambezi Stack Special (PD)".

Note: There might also be some performance retardation in some applications when enabled (Zambezi vs. Vishera effect).

Zambezi is significantly faster than Vishera in SuperPI by default so the difference between a "fixed" Vishera and a tuned Zambezi won't be that massive after the "Zambezi Stack Special" configuration.

k7ez.jpg

Link to comment
Share on other sites

Μόλις ασχολήθηκα αμυδρά και απλά κόλλησα!

Καλά είναι δυνατόν να ξεφεύγει μια τόσο μεγάλη βελτίωση απο τους μηχανικούς της AMD?

Μπράβο στο παλικάρι που ασχολήθηκε... αυτό έχω να πω...

Θα με ενδιέφερε αφάνταστα να διαβάσω και κάποια επίσημη τοποθέτηση της AMD γι αυτό το θέμα...

Link to comment
Share on other sites

Θα σου πώ τη γνώμη μου.

Η AMD εδώ και αρκετά χρόνια , έχει χάσει τη μάχη του clock to clock ... και ειδικά σε singlethreaded εφαρμογές.

Οταν δέ , πολύ περισσότερο , αυτές οι εφαρμογές βασίζονται στην πολύ παλιά αρχιτεκτονική του x87 ... καταλαβαίνεις ότι απλά δέν ασχολήθηκαν.

Πολύ κακώς βέβαια , γιατί έτσι έχασαν το κόλπο του μάρκετινγκ.

Γιατί το superpi π.χ. χρησιμοποιείται κατά κόρον από πάρα πολλά review-sites ώς ενδεικτικό της ταχύτητας λειτουργίας και έτσι έχασαν στα μάτια του κόσμου.

Ενώ στην πράξη , στις σημερινές real-life εφαρμογές (όπως λέμε) αυτό το fix είναι πρακτικά χωρίς εφαρμογή.

Link to comment
Share on other sites

Ετοιμο το προγραμματάκι του stilt !!!

Ηδη όσοι το δοκίμασαν έχουν ποστάρει αποτελέσματα , που δείχνουν στην πράξη εντυπωσιακή βελτίωση στο superpi.

Εκτός από το link του quote , το πρόγραμμα έχει γίνει re-hosted και στο hwbot.

http://downloads.hwbot.org/downloads/tools/BDC_R1.00B.zip

So, it is friday today isn't it wink.gif

Bulldozer Conditioner R1.00B

The checksum (MD5) for the zip file is: 418522A93F241CF14EB1D775839AB083

If the checksum does not match the package has been tampered with = delete and re-download from another location.

The checksum can be calculated online if you don't have a suitable software on your computer.

http://onlinemd5.com/

There is not a single bit of malicious code either in the driver or the software itself.

If you are unsure, please check the contents with https://www.virustotal.com

Supported OS: Windows XP / Windows Vista / Windows 7 / Windows 8 (32 & 64-bit)

The x86 version works in both 32 & 64-bit operating systems, while the x64 version is 64-bit only.

The functionality itself is identical between the versions.

Known limitations: Up to 16 CUs (32 cores) supported at the moment. Support for 32CUs (64 cores) will be added in the next version.

Also the R1.00B (Beta) version does not contain the feature to patch the microcode block as I could not make it work stable enough.

The "Errata Fix" button will fix the major errata which can be patched without updating the microcode.

This feature should not be used as a permanent solution, the bios update should still be used as a primary method (updated AGESA + microcode).

Note: Enabling "Zambezi Stack Special (PD)" feature might cause undefined behavior, however each user should test it's functionality on their own. Some applications might indicate a minor retardation in performance, however SuperPI for example receives a nice boost.

Note: "x87 instruction (NRAC) block" -> Enabled means that the instruction is blocked (default on all 15h family APU/CPU/NPUs). Disabling it make the SuperPI "a bit" faster.

There are most certainly some bugs, so in case you come across one, please report them to this thread.

The experiences are very welcome also.

No it is time for the midsummer parties so I might be away for a day or two.

Depending on how epic the headache shall be wink.gif

Link to comment
Share on other sites

Archived

This topic is now archived and is closed to further replies.

×
×
  • Δημιουργία...

Important Information

Ο ιστότοπος theLab.gr χρησιμοποιεί cookies για να διασφαλίσει την καλύτερη εμπειρία σας κατά την περιήγηση. Μπορείτε να προσαρμόσετε τις ρυθμίσεις των cookies σας , διαφορετικά θα υποθέσουμε ότι είστε εντάξει για να συνεχίσετε.