Jump to content



System Stability Tester vs SuperPI


DarthMoul

Recommended Posts

Sorry αν έχει υπωθεί πουθενά, αλλά μου διαφεύγει, ο κώδικας που είναι διαθέσιμος ?

Πληροφορίες για το ποιός compiler χρησιμοποιήθηκε και με ποιά flags υπάρχει ?

Ότι χρειάζεσαι είναι εδώ. Χρησιμοποιούμε πάντα τον native compiler του κάθε λειτουργικού με default settings. Φυσικά όποιος θέλει κάνει compile με τα settings και τον compiler που νομίζει ότι θα τον ευνοήσουν.

Link to comment
Share on other sites

  • Replies 157
  • Created
  • Last Reply
35 στο SPI???ΕΛΕΟΣΣΣΣΣΣΣΣΣΣΣΣΣΣΣ:046: :046: :046:

Εγώ με τον Opt 144 στα 2.9 έβγαζα 28!!!

ρε χαζούλη, χαίρω πολύ...δεν κάνω τίποτα σοβαρό πια...αυτό σε πείραξε ή η διαφορά με το systester? που είναι χαώδης...

να μείνουμε στο θέμα μας...:)

@darth: είναι θέμα κώδικα τέτοια διαφορά σε μένα?

Link to comment
Share on other sites

800αρες μνημες με 5αρια.64 bit vista sp1

3600mhz

Πως τα καταφερες και εβγαλες 14.414s και στα δυο?:D

Αυτό που ψάχνω εδώ είναι κατά πόσο είναι δίκαια τα παράπονα που διαβάζω σε διάφορα forums, από ανθρώπους που έχουν Intel, ότι ο tester αδικεί την Intel.

Οχι απο μενα παντως:D

Υποθετικη ερωτηση...αν τον κλειδωνες, εφτιαχνες και validation data base υπηρχε περιπτωση να τον δεχοταν το hwbot για benchmark στην θεση του SuperPi?;)

stealth

Link to comment
Share on other sites

@darth: είναι θέμα κώδικα τέτοια διαφορά σε μένα?

Αν έτρεξε ο ίδιος κώδικας και στους δύο, δεν νομίζω να είναι θέμα κώδικα. Κάτι άλλο έχει συμβεί. Μπορεί να έτρεχε κάτι στο background ή να έχει πρόβλημα η cache και να αναγκάζεται να κάνει ecc corrections που δεν είναι ορατά σε εσένα. Αν δεν έτρεχε κάτι στο background, κοίταξε τι διαφορές έχετε στο hw.

DarthMoul added 2 Minutes and 48 Seconds later...

Υποθετικη ερωτηση...αν τον κλειδωνες, εφτιαχνες και validation data base υπηρχε περιπτωση να τον δεχοταν το hwbot για benchmark στην θεση του SuperPi?;)

stealth

Πιστεύω θα το δεχόταν μαζί με το SuperPi, όχι στην θέση του. Δεν πρόκειται να το κλείσω πάντως.

Link to comment
Share on other sites

Αν έτρεξε ο ίδιος κώδικας και στους δύο, δεν νομίζω να είναι θέμα κώδικα. Κάτι άλλο έχει συμβεί. Μπορεί να έτρεχε κάτι στο background ή να έχει πρόβλημα η cache και να αναγκάζεται να κάνει ecc corrections που δεν είναι ορατά σε εσένα. Αν δεν έτρεχε κάτι στο background, κοίταξε τι διαφορές έχετε στο hw.

δεν πρόκειται να δω σε super pi κάτω από 30 sec χωρίς να αγγίξω τα 3ghz...δεν είναι θέμα background, είναι θέμα προγράμματος...

όλοι οι amd μάχονται να κατεβούν σε sec στο super pi, ενώ στο δικό σου πρόγραμμα πετάνε....

Link to comment
Share on other sites

Μια παρενθεση οφφ τοπικ,παρατηρησε κανεις να βελτιωνεται το Ο/C μονο με τον systester?Παρολο που τρεχω πολλα τεστ σταθεροτητας για να βρω το χρυσο σημειο του 7750ΒΕ με 8GB ram σε ο/c και σταθεροτητα,μετα απο 8 loop 128Μ στον systester εγινε σταθερος στα 3270 με ~1.375-1.38 ρευμα και 4*2GB@930,πριν εκανε fail σε ολα τα προγραμματα και ηθελε 1.40 για τα ιδια.ΧΡ 64bit ολα αυτα.

ΧΡ64 αποτελεσματα δεχεστε σε screenshot?

Link to comment
Share on other sites

Πως τα καταφερες και εβγαλες 14.414s και στα δυο?:D

stealth

χεχε μου εβγαλε το pi λιγοτερο μπορει και το system αλλα επειδη 2 φορες μου εβγαλαν και τα δυο τους 14.414...ειπα δεν μπορει..."θελουν" να το ποσταρω:033:

Θελω να ποσταρω και απο το P3 μου να δω...:046:

Αυτα τα προγραμματα επηρεαζονται αρκετα απο την μνημη...πρεπει να βαλω τις d9dqt να κατεβουν λιγο οι χρονοι:)

Link to comment
Share on other sites

Το superpi σου δεν βλεπω.:p

Νομιζω ο Λουκας ζητησε και superpi για να δουμε τη διαφορα μεταξυ των δυο μετροπρογραμματων...:)

...και επίσης σε 32 bit κι εσύ postαρες 64:)

κάπου 27.5 βγάζω Pi. Και στο κάτω κάτω υπάρχουν άπειρα databases με superpi σε Phenom, σε όλες τις συχνότητες. Δηλαδή αν postara screenshot με 20 sec θα με πίστευες; Το θέμα δεν είναι αν βγάλω 27 ή 25 ή 30, το θέμα είναι η χαοτική διαφορά με το stability tester σε ΑΜΔ. Σε Intel έχει νόημα η σύγκριση γιατί βγάζουν παραπλήσιο.

ΠΑΡΑΤΗΡΗΣΗ: Αν στο tester δηλώσετε afinity μόνο σε ένα core, το score βελτιώνεται ελαφρώς, αλλά πάντα.

Link to comment
Share on other sites

Καλησπέρα, έκανα και εγώ κάποιες μετρήσεις στα 6 μηχανήματα που μπορώ να

έχω πρόσβαση. Τα 2 απο αυτά (C2D - Conroe και AMD Opteron148) έχω πρόσβαση

μόνο μέσω VNC. Όλα τα μηχανήματα (6) τρέχουν Window$XP Pro SP2.

Στα 3 Intel μηχανήματα (P4C-HT, C2D-Conroe και C2D-Merom (laptop)) παρατηρήθηκαν

μικρές διαφορές ανάμεσα στα 2 προγράμματα. Η μεγαλύτερη διαφορά ήταν αυτή

του P4C-HT (~3,8sec).

Στα 3 AMD μηχανήματα (Opteron148, Opteron170 και Phenom9950) οι διαφορές ήταν

πολύ μεγάλες. Στην ουσία το systester 1.0.0 υπολόγιζε τα 1Μ ψηφία στο μισό

και λίγο λιγότερο χρόνο απο το superPi 1.5mod.

Τα αποτελέσματα φαίνονται στο παρακάτω πίνακα :

attachment.php?attachmentid=24099&stc=1&d=1235227490

Επιπλέον έκανα και άλλο ένα πείραμα. Το ένα απο τα AMD μηχανήματα (Opteron170)

έχει και Linux (Gentoo x86_64 - 2.6.24-r8). Είπα λοιπόν να κάνω μετρήσεις και στο

Linux. Ετρεξα λοιπόν το superPi 1.5mod και το systester 1.0.0 (win32 binary)

μέσω wine (v 1.1.4) και επιπλέον το systester amd64 binary, το systester sources

κάνοντας compile με τα default CFLAGS (-march=opteron -O2 -pipe) και το systester

sources κάνοντας compile με τα CFLAGS του συστήματος

(-march=opteron -O2 -msse3 -funroll-loops -finline-limit=900 -falign-functions=64 -fomit-frame-pointer -pipe)

Οι διαφορές για τα 3 τελευταία systester είναι της τάξης του ~0.1 sec οπότε δεν

έχει τόση σημασία να μπουν και τα 3 στο πείραμα.

Οι διαφορές στα 2 προγράμματα (win32 binaries) ανάμεσα στα Window$ και στο Linux (wine ver 1.1.4)

είναι πολύ μικρές με το systester να χάνει 0.6 sec στο wine ενώ το superPi να κερδίζει

περίπου 0,2 sec στο wine. Οι διαφορές αυτές είναι μέσα στο στατιστικό σφάλμα των

2 προγραμμάτων αν τα τρέξουμε πολλαπλές φορές.

Η διαφορά μεταξύ των 2 προγραμμάτων παρέμεινε και στο Linux (wine).

To systester για linux [x86_64] (compile με custom flags) χρειάστηκε λιγότερο

απο το μισό χρόνο που χρειάστηκε το systester win32 binary και λιγότερο απο

το 1/4 του χρόνου που χρειάστηκε το superPi win32 binary για τον υπολογισμό

των 1Μ ψηφίων του π (52% και 77% αντίστοιχα).

Όλα αυτά φαίνονται στο παρακάτω γράφημα :

attachment.php?attachmentid=24100&stc=1&d=1235227490

Όσον αφορά την κουβέντα για το ποιο πρόγραμμα ευνοεί ποιον επεξεργαστή, το μόνο

για το οποίο μπορούμε να μιλήσουμε είναι το systester, για το οποίο ξέρουμε

τον κώδικα και μπορούμε να δούμε τι ακριβώς κάνει. Απ'οσο ξέρω στο systester

χρησιμοποιείται η βιβλιοθήκη gmp (GNU Multiple Precision Arithmetic Library).

Στο site της GMP υπάρχει ένας πίνακας με μετρήσεις του gmp-chudnovsky

(πρόγραμμα υπολογισμού ψηφίων του π) στον οποίο φαίνεται οτι στα ίδια GHz οι

επεξεργαστές της AMD (Opteron) είναι περίπου 20% ποιο γρήγοροι απο τους αντίστοιχους

επεξεργαστές της Intel (Core2) για υπολογισμούς μεγάλου αριθμόυ ψηφίων του π.

Αν τις παραπανω μετρήσεις (εξαιρώντας τον P4C-HT - αρκετά παλιά αρχιτεκτονική) τις κατατάξουμε

σε αύξουσα σειρά με βάση τα GHz του επεξεργαστή και όπου έχουμε "ισοπαλία", με βάση τα ΜΗz της μνήμης

τότε παρατηρούμε το εξής "παράδοξο" :

(1) Στο systester έχουμε ομαλή πτώση του χρόνου εκτέλεσης σε σχέση με την αύξηση των GHz του

επεξεργαστή εκτός απο μια πολύ μικρή διαφορά στους 2 opteron, όπου ο Optoren170 στα 2.35GHz

υπολογίζει ~1sec πιο γρήγορα απο τον Opteron148 στα 2.64GHz. Στη συγκεκριμένη περίπτωση πιστεύω

οτι η μικρή διαφορά οφείλεται στη διαφορά 100MHz στο χρονισμών των μνημών των 2 συστημάτων.

(2) Στο SuperPi έχουμε 2 διαφορετικές γραμμές, μια για κάθε εταιρία κατασκευής επεξεργαστών.

Όσον αφορά την Intel υπάρχει ομαλή πτώση του χρόνου εκτέλεσης με την άυξηση των MHz της μνήμης, μιας

και οι 2 επεξεργαστές (C2D) είναι χρονισμένοι στα ίδια GHz. Στην AMD υπάρχει ομαλή πτώση σε σχέση

με τα GHz του επεξεργαστή. Το παράδοξο είναι οτι ανάμεσα στις 2 εταιρίες υπάρχει ένα χάσμα

περίπου 10 sec, το οποίο "συναντιέται" στα 26 sec μεταξύ του C2D T7250 στα 2GHz και του Phenom9950

στα 3GHz. Στο συγκεκριμένο "ζευγάρι" επεξεργαστών ενώ η διαφορά τους στα GHz είναι 50% υπέρ του

Phenom η διαφορά τους στο SuperPi είναι της τάξης του 1.9% ενώ η διαφορά τους στο systester

είναι της τάξης του 52%.

Το γράφημα φαίνεται παρακάτω :

attachment.php?attachmentid=24101&stc=1&d=1235227490

Αν λάβουμε υπόψη μας τα παραπάνω για τη βιβλιοθήκη GMP, ως δεδομένα και αυξήσουμε τους

χρόνους του systester για τους επεξεργαστές της AMD κατα 20% παρατηρούμε οτι πάλι η πτώση του

χρόνου επεξεργασίας σε σχέση με τα GHz του επεξεργαστή είναι ομαλή (πιο ομαλή απο πριν στο

σημείο αλλαγής του κατασκευαστή). Αυτο μας οδηγεί στο συμπέρασμα οτι η διαφορά μεταξύ του

systester και του SuperPi για τους επεξεργαστές της AMD δεν οφείλεται στη χρήση ή όχι της

βιβλιοθήκης GMP. To γράφημα φαίνεται παρακάτω :

attachment.php?attachmentid=24102&stc=1&d=1235227490

Απο τον αλγόριθμο Gauss-Legendre για τον υπολογισμό του π βλέπουμε οτι όλες οι πράξεις που

γίνονται είναι πράξεις μεταξύ floating-point αριθμών, οπότε τον κύριο λόγο για τους υπολογισμούς

τον έχει η FPU του επεξεργαστή. Η FPU ενός επεξεργαστή κατα κύριο λόγο θα πρέπει να ακολουθεί

ένα συγκεκριμένο standard (IEEE 754) και απο εκεί και πέρα η απόδοση της εξαρτάται απο την

εκάστοτε υλοποίηση, τα διάφορα "optimizations" του κατασκευαστή και τον χρονισμό της.

Στα "optimizations" αναφέρονται τα διάφορα "κόλπα" που κάνουν οι κατασκευαστές για γρήγορο υπολογισμό

συγκεκριμένων συναρτήσεων και οι διάφορες περετέρω εντολές.

Απο το τελευταίο γράφημα είναι ξεκάθαρο οτι οι FPUs των επεξεργαστών Intel και AMD δεν διαφέρουν

πάρα πολύ σε απόδοση παρα μόνο αν είναι χρονισμένες σε μεγαλύτερα GHz. Σε διαφορετική περίπτωση

το γράφημα του systester (ή του systester + 20%) θα ήταν πολύ διαφορετικό. Αν για παράδειγμα η

FPU ενός Intel επεξεργαστή είχε "optimizations" για τον υπολογισμό του π με βάση τον αλγόριθμο

Gauss-Legendre (SuperPi) τότε θα υπήρχε η ίδια διαφορά και στο systester χρησιμοποιόντας τον

ίδιο αλγόρθμο και κάντοντας τους ίδιους υπολογισμούς.

Λαμβάνοντας υπόψην οτι ο κώδικας του systester είναι ανοιχτός και διαθέσιμος σε όλους σε αντίθεση

με τον κώδικα του superPi, που για λόγους που δε μπορώ να καταλάβω, παραμένει κλειστός και "σφραγισμένος",

εγώ μόνο ένα λογικό συμπέρασμα μπορώ να βγάλω. Το superPi μάλλον ευνοεί τους επεξεργαστές της Intel.

Παραθέτω και τα screenshots απο τα "πειράματα"

post-170-1442175416,4357_thumb.jpg

post-170-1442175416,6035_thumb.jpg

post-170-1442175416,7914_thumb.jpg

post-170-1442175416,9064_thumb.jpg

post-170-1442175417,0151_thumb.jpg

post-170-1442175417,1178_thumb.jpg

post-170-1442175417,2248_thumb.jpg

post-170-1442175417,3269_thumb.jpg

post-170-1442175417,4273_thumb.jpg

post-170-1442175417,5185_thumb.jpg

Link to comment
Share on other sites

ΧΡ64 αποτελεσματα δεχεστε σε screenshot?

Τα πάντα δεχόμαστε αλλά δεν μπορούμε να κάνουμε σύγκριση με το super pi που είναι 32 bits. Η 32 bit έκδοση του tester τρέχει και σε 64μπιτα win, οπότε μπορείς να συμμετέχεις κανονικά. Επίσης 32 και 64 bit εκδόσεις του tester μπορούν να συνυπάρχουν χωρίς πρόβλημα στο ίδιο σύστημα και δεν χρειάζεται να βγάλεις την μία για να βάλεις την άλλη.

Link to comment
Share on other sites

@backgroundman:

Το ξέρω από καιρό ότι η μεθοδικότητα σου είναι παρομοιώδης, αλλά σήμερα με άφησες άφωνο!!!

Νομίζω πιο θεμελιωμένη απάντηση στα ερωτηματικά μας δεν θα μπορούσαμε να έχουμε.

Link to comment
Share on other sites

Αν μαζευτουνε πολλα δεδομενα και μεταβλητες οπως:cpu type,l2 cache,mem timings,mem type etc, μπορω να σας κανω μια στατιστικη αναλυση δεδομενων με το spss..τωρα που την περασα και ξερω:033: :046: .Απο βδομαδα που θα τελειωσει η εξεταστικη.

Να βγει πχ ενα γραμμικο μοντελο που να ερμηνευει το pi σε σχεση με τα μυρια,μνημη κλπ.Ποσο pi θα ειχαμε με 12ghz,20mbl2 και μνημες 3ghz???...ε αυτο..

Link to comment
Share on other sites

Εύκολα κάτω από 30.Εγώ πώς το έκανα??

οι μνήμες μου δεν το επιτρέπουν...να σφίξω timings...με 3-4-4 μέχρι 270 με 275 μπορούσα να παίξω.....τεσπα...

να δούμε και άλλες μετρήσεις..:033:

Link to comment
Share on other sites

@backgroundman:

Το ξέρω από καιρό ότι η μεθοδικότητα σου είναι παρομοιώδης, αλλά σήμερα με άφησες άφωνο!!!

Νομίζω πιο θεμελιωμένη απάντηση στα ερωτηματικά μας δεν θα μπορούσαμε να έχουμε.

Ευχαριστώ πολύ.

Απο τις πρώτες εκδόσεις του systester (με τον Gauss-Legendre) είχα

παρατηρήσει τις διαφορές που είχε με το SuperPI στους επεξεργαστές της

AMD και τις διαφορές που ΔΕΝ ειχε στους Intel. Αμέσως μου μπήκαν ιδέες

μιας και το SuperPi χρησιμοποιείται πολύ για μέτρηση επιδόσεων απο πολλούς

χρήστες (σχετικούς και μη). Διάβαζα σε διάφορα site οτι υποψιάζονται

"πειραγμένους" τους νέους Intel ωστε να τρέχουν πιο γρήγορα το superPI.

Κάτι τέτοιο βέβαια θα είχε αποτέλεσμα και στο systester, πράγμα που δεν

ήταν αλήθεια. Αμέσως υποψιάστηκα το superPI.

Το συγκεκριμένο thread με έβαλε στο "κόπο" να κάνω τις μετρήσεις και να

βγάλω τις γραφικές.

Αυτό που φαίνεται καθαρά για μένα δεν είναι οτι το superPi ευνοεί τους Intel

(όπως γράφω παραπάνω) αλλα οτι το SuperPi "κρατάει" πίσω τους AMD.

Προφανώς (για μένα) έχουν "πειράξει" το superPi.

Σε εμένα φαίνεται καθαρά πλέον οτι το superPi τρέχει

άλλο κώδικα για AMD και άλλο για Intel. Εγώ δε βρίσκω άλλη λογική

εξηγηση για τέτοιες διαφορές στους ίδιους υπολογισμούς...

Αυτό βέβαια απο τη στιγμή που ο κώδικας του SuperPi

είναι κλειστός και "σφραγισμένος" δε μπορεί να το επιβεβαιώσει κανείς.

Αλήθεια ξέρει κανείς γιατι ένα προγραμματάκι του κ*λου που διανέμεται

δωρεάν και χρησιμοποιείται απο τους περισσότερους για τη κατάταξη των

επεξεργαστών, πρέπει να είναι κλειστού κώδικα.

Ποτέ δε κατάλαβα τη μανία των περισσοτέρων για χαμηλότερα νούμερα στο

superPi. Απο την εμπειρία μου τα χαμηλότερα νούμερα στο superPi δε

σημαίνουν τίποτα απολύτως για τον επεξεργαστή (ειδικά αν είναι AMD)...

Link to comment
Share on other sites

Archived

This topic is now archived and is closed to further replies.

×
×
  • Δημιουργία...

Important Information

Ο ιστότοπος theLab.gr χρησιμοποιεί cookies για να διασφαλίσει την καλύτερη εμπειρία σας κατά την περιήγηση. Μπορείτε να προσαρμόσετε τις ρυθμίσεις των cookies σας , διαφορετικά θα υποθέσουμε ότι είστε εντάξει για να συνεχίσετε.