Jump to content



System Stability Tester vs SuperPI


DarthMoul

Recommended Posts

Απ' όσο ξέρω είναι εμπορικό προϊόν. Ίσως να υπάρχει κανένα demo.

Ερώτηση Off-topic αλλα έχω την απορία. Απο τη στιγμή που η GMP είναι

με άδεια GNU, πως γίνεται ένα closed-source πρόγραμμα σα το mathematica

να τη χρησιμοποιεί και να το λέει...?

Κατα τα άλλα θα συμφωνήσω μαζί σου. Απο τη στιγμή που ο tester και το

Mathematica χρησιμοποιούν την GMP και απο την άλλη το tester είναι και

open-source και ξέρουμε ακριβώς τι γίνεται γιατι να πάμε στο Mathematica ?

Link to comment
Share on other sites

  • Replies 157
  • Created
  • Last Reply
Ερώτηση Off-topic αλλα έχω την απορία. Απο τη στιγμή που η GMP είναι

με άδεια GNU, πως γίνεται ένα closed-source πρόγραμμα σα το mathematica

να τη χρησιμοποιεί και να το λέει...?

Κατα τα άλλα θα συμφωνήσω μαζί σου. Απο τη στιγμή που ο tester και το

Mathematica χρησιμοποιούν την GMP και απο την άλλη το tester είναι και

open-source και ξέρουμε ακριβώς τι γίνεται γιατι να πάμε στο Mathematica ?

H GMP είναι με LGPL άδεια χρήσης που σημαίνει ότι μπορείς να την συμπεριλάβεις σε εμπορικό closed source προϊόν, αρκεί να μην πειράξεις τον δικό της κώδικα. Αν τον πειράξεις, θα πρέπει να υποβάλεις τις αλλαγές στους maintainers και αυτές θα πάνε open source. Αυτό έχει κάνει και η Intel στα Math Kernel Libraries. Συμπεριέλαβε ένα κομμάτι της GMP, το βελτιστοποίησε για τις δικές της CPU και έδωσε τον κώδικα των αλλαγών που έκανε. Έτσι έχουμε low level assembly optimized κώδικα για Intel chips στην GMP, από την ίδια την Intel, και η Intel έκανε την δουλειά της.

Επειδή έχω κάνει την δοκιμή, το mathematica και το maple που χρησιμοποιούν GMP, είναι κατά ένα αμελητέο ποσοστό πιο αργά από τον tester αφού παρεμβάλουν ένα επιπλέον software layer. Κατά τα άλλα η συμπεριφορά τους είναι ακριβώς ίδια.

Γενικότερα οι x86 της Intel είναι μακράν η χειρότερη επιλογή για bignums. Η Intel γι αυτή την δουλειά έχει τους Itanium. Αν θέλεις bignums σε x86, η AMD είναι μονόδρομος.

Link to comment
Share on other sites

Με λιγα λόγια η GMP είναι Intel optimized.

Είναι λογικό οι εταιρίες hardware με τις δυνατότερες συμμαχίες (Intel, Nvidia) να επηρεάζουν το software. Δεν είναι τυχαίο πως όταν κυκλοφόρησαν οι πρώτοι Athlon64, δεν υπήρχαν 64bit Windows.

Πάντως είναι κρίμα που ενώ πλέον μπορούμε και αγοράζουμε πολυπύρηνες 64Bit cpu, το μεγαλύτερο μέρος των προγραμμάτων είναι 32bit. Tουλάχιστο νιώθουμε ότι η "επένδυσή" μας θα κρατήσει περισσότερο καιρό.

Link to comment
Share on other sites

Καλησπερα, εκανα τα πειράματα σε linux (Gentoo) με το superpi για linux και

τα αποτελέσματα φαίνονται στον παρακάτω πίνακα και γράφημα

attachment.php?attachmentid=24177&stc=1&d=1235602630

Στο γράφημα φαίνεται η διαφορά ανάμεσα στο superPi και το Systester

για τους 2 επεξεργαστές για υπολογισμό 1MB,2MB και 4ΜΒ ψηφίων του π.

Θετική διαφορά σημαίνει οτι το systester είναι πιο γρήγορο απο το superPi

ενώ αρνητική σημαίνει οτι το systester είναι πιο αργό απο το superPi.

Το ενδιαφέρον που φαίνεται στο γράφημα είναι οτι όσο περισσότερα

ψηφία υπολογίζουμε με Intel τόσο πιο γρήγορο γίνεται το superPi (linux)

σε σχέση με το systester και φτάνει το ~16% στα 4ΜΒ.

Απο την άλλη το φαινόμενο της μεγάλης διαφοράς μεταξύ των 2

προγραμμάτων, που είδαμε στα Window$, για επεξεργαστές AMD φαίνεται

καθαρά και στο Linux. Επιπλέον παρατηρούμε οτι η διαφορά αυτή μειώνεται

καθώς αυξάνονται τα ψηφία του π που υπολογίζουμε, ξεκινώντας απο

~74% για 1ΜΒ και φτάνοντας στο ~45% για 4ΜΒ.

Στα attachments υπάρχουν και τα screenshots απο τα πειράματα. Στο

μηχάνημα με τον AMD Opteron170 έχω τρέξει και τον systester x86_64 για

να δείτε τις διαφορές μεταξύ 32bit και 64bit σε AMD.

post-170-1442175424,5285_thumb.jpg

post-170-1442175424,6377_thumb.jpg

post-170-1442175424,6865_thumb.jpg

post-170-1442175424,7307_thumb.jpg

post-170-1442175424,7723_thumb.jpg

post-170-1442175424,8414_thumb.jpg

post-170-1442175424,8978_thumb.jpg

Link to comment
Share on other sites

Το -march=prescott δεν αποδίδει καλά στους core. Με gcc 4.3 και -march=core2 μπορεί να κερδίζεις μέχρι και 5%. Υπόψιν ότι θα πρέπει να κάνεις recompile την gmp με αυτά τα flags για να δεις την διαφορά στον tester. Πάντως και πάλι το γράφημα θα βγει το ίδιο με ένα μικρό shift στην καμπύλη της intel.

EDIT: Τώρα το είδα. Ο core τρέχει 32 μπιτο Linux. Μάλλον το -march=pentium3 σε ευνοεί καλύτερα, χωρίς να χρειάζεται να αλλάξεις compiler.

Link to comment
Share on other sites

To superpi για linux είναι 32bit σωστά;

Επίσης, φαντάζομαι o Intel θα έβγαζε καλύτερο score στο systester αν έτρεχε σε 64bit Gentoo;

Να παρατηρήσω επίσης, ότι ο Opteron 170 είναι Κ8, οπότε με Κ10 στα ίδια ρολόγια λογικά θα είχαμε μια ποσοστιαία βελτίωση. Το λέω επειδή υποτίθεται συγκρίνουμε αρχιτεκτονικές core 2 duo και Κ10, που έχουν παρόμοιο κόστος στις mainstream cpu αυτό τον καιρό.

Πάντως, αν συνυπολογίσουμε ότι στο test ο Opteron έχει σχεδόν 20% υψηλότερη συχνότητα, πάλι μεγάλη είναι η διαφορά στο SuperPi μεταξύ AMD-INTEL. Και ακόμα μεγαλύτερη στον AMD μεταξύ SuperPi και Systester.

Aν βρω χρόνο το ΣΚ, ίσως κάνω μερικές μετρήσεις κι εγώ με Agena 9550 vs Core 2 duo 6850, σε xp64, xp32 και suse 32. (Αλήθεια, θα επηρεάσει πολύ τα συμπεράσματα αν γίνουν σε VM με hardware acceleration, μιας και έχω έτοιμα τα VMs;). Αν και πλέον δεν ξέρω αν έχει νόημα, το γενικό συμπέρασμα δεν πρόκειται να επηρεαστεί νομίζω.

Θέλω πάντως να ξανα - διατυπώσω μια γενικότερη "ένσταση", όσο αφορά τα μετροπρογράμματα.

Υποτίθεται ένα μετροπρόγραμμα κρίνει έναν επεξεργαστή, για μια συγκεκριμένη λειτουργία. Πχ το wprime δείχνει ταχύτητα στον υπολογισμό τετραγωνικών ριζών, το superpi δείχνει την ταχύτητα στον υπολογισμό δεκαδικών του pi, και δη στις πράξεις ακεραίων. Εφ' όσον όμως δεν το κάνει καλά, είτε επειδή είναι παλιό και δεν λαμβάνει υπ' όψιν τις νέες αρχιτεκτονικές, είτε επειδή σκοπίμως αδικεί κάποιες cpu, γιατί να λαμβάνεται υπ΄όψιν; Αφού στην ουσία ένας Κ8-Κ10, όπως αποδεικνυεται, είναι εξίσου ικανός στη συγκεκριμένη λειτουργία υπολογισμού.

Ακόμα και αν υποθέσουμε ότι κάποιος θέλει πράγματι να υπολογίσει 32m δεκαδικά του pi, γιατί να χρησιμοποιήσει ένα πρόγραμμα που δεν εκμεταλεύεται τις δυνατότητες του επεξεργαστή του; Όπως και κάποιος με Pentium 4 δεν έχει λόγο να κάνει video editing - encoding με κάποια εφαρμογή που δεν εκμεταλεύεται το HT και sse3, αφού αυτά τα χαρακτηριστικά πλήρωσε και υπάρχουν άλλες εφαρμογές που τα εκμεταλεύονται.

Τέτοιες παραχωρήσεις - "κολήματα" σε μετροπρογράμματα, έχουν νόημα μόνο αν υπάρχει πρακτικός λόγος συμβατότητας/ευκολίας. Παράδειγμα, το 7zip συμπιέζει ταχύτερα και έχει και 64bit έκδοση, σε αντίθεση με το winrar. Ωστόσο το 2ο το βρίσκω πιο εύχρηστο και πρακτικό, το χρησιμοποιώ, οπότε με ενδιαφέρει να βλέπω μετρήσεις από winrar, κι ας μην εκμεταλεύεται πλήρως τις δυνατότητες του επεξεργαστή μου.

Τώρα σε επιπεδο «κόντρας» και χαβαλέ οκ, ας τρέχουμε superpi . Κι εγώ το έχω κάνει κάμποσες φορές. Αλλά μέχρι εκεί. Aν η επόμενη VGA της AMD σχεδιαστεί να βγάζει κορυφαίο 3dmark99, δεν νομίζω να τρέξει κανείς να την αγοράσει γι αυτό, ούτε να τη χαρακτηρίσει ταχύτερη του ανταγωνισμού.

Link to comment
Share on other sites

To superpi για linux είναι 32bit σωστά;

Επίσης, φαντάζομαι o Intel θα έβγαζε καλύτερο score στο systester αν έτρεχε σε 64bit Gentoo;

O backgroundman σύγκρινε systester 32 bits vs superpi που είναι 32 bits. Ο 32μπιτος κώδικας δεν κερδίζει τίποτα αν τρέξει σε 64 bit περιβάλλον. Αν κερδίσει θα είναι εξαιτίας του μικρότερου overhead που ίσως να έχει το 64 μπιτο λειτουργικό και όχι εξαιτίας του εαυτού του.

Aν βρω χρόνο το ΣΚ, ίσως κάνω μερικές μετρήσεις κι εγώ με Agena 9550 vs Core 2 duo 6850, σε xp64, xp32 και suse 32. (Αλήθεια, θα επηρεάσει πολύ τα συμπεράσματα αν γίνουν σε VM με hardware acceleration, μιας και έχω έτοιμα τα VMs;). Αν και πλέον δεν ξέρω αν έχει νόημα, το γενικό συμπέρασμα δεν πρόκειται να επηρεαστεί νομίζω.

Τα VMs επιρεάζουν απρόβλεπτα το ρολόι για τα guest λειτουργικά. Οπότε οι χρονομετρήσεις που θα πάρεις θα είναι εντελώς επισφαλείς.
Link to comment
Share on other sites

EDIT: Τώρα το είδα. Ο core τρέχει 32 μπιτο Linux. Μάλλον το -march=pentium3 σε ευνοεί καλύτερα, χωρίς να χρειάζεται να αλλάξεις compiler.

Στο Gentoo Wiki για Safe GCC Flags αναφέρεται

οτι για 32bit gentoo και core2 επεξεργαστή να

χρησιμοποιηθεί το march=prescott. Λες οτι το

march=pentium3 παράγει πιο γρήγορο κώδικο

για τον core2 γενικά ή αναφέρεσαι μόνο στη GMP ?

Link to comment
Share on other sites

Στο Gentoo Wiki για Safe GCC Flags αναφέρεται

οτι για 32bit gentoo και core2 επεξεργαστή να

χρησιμοποιηθεί το march=prescott. Λες οτι το

march=pentium3 παράγει πιο γρήγορο κώδικο

για τον core2 γενικά ή αναφέρεσαι μόνο στη GMP ?

Από αυτά που διαβάζω στο dev-list του gcc, το -march=prescott επιβάλλει netburst optimizations. Ο core2 είναι πιο κοντά στους pentium3 παρά στους netburst.

Link to comment
Share on other sites

  • 2 weeks later...
  • 2 weeks later...
Δηλ Hipro5, Stelaras, gorillakos αντιπροσωπεύουν το "μέσο χρήστη" που παίζει 24/7 με αέρα με κομμάτια μέσου όρου. Μαζί σου. Εξακολουθείς να πουλάς τρέλα.

Τι να σου πω, αντί να μπαίνεις στον κόπο να listάρεις τα 100άδες αδέλφια - ξαδέλφια - φίλους - γνωστούς που όλοι πήρατε ομαδική I7, κάνε μια αναζήτηση στο γούγλη "I7 high temps", μετά "deneb high temps", "phenom 940 high temps" και μέτρα αποτελέσματα. Ακόμα και σκέτο "phenom high temps", που περιλαμβάνει τόσους ενεργοβόρους Agena 1+ χρόνου πάλι λιγότερα αποτελέσματα βγάζει.

Σταματώ το offtopic και ζητώ συγνώμη από τους υπόλοιπους. Προφανώς μπορείτε να ανέχεστε τo υφάκι των post του. Εγώ όχι, γι αυτό και (κακώς) έγινα επίσης προκλητικός.

Σχεδόν 70 default στο καταχείμωνο δεν είναι λίγο παιδιά. Θερμοκρασίες Prescott είναι. Δε διαφωνώ ότι είναι δικαιολογημένες σε σχέση με τις δυνατότητες του επεξεργαστή. Αλλά πάντα όταν δοκιμάζουμε σταθερότητα και θερμοκρασίες, το κάνουμε στη δυσμενέστερη περίπτωση, δηλ. full load τους πυρήνες επί ώρα, για να είμαστε σίγουροι. Εκτός κι αν ξέρουμε ότι δεν πρόκειται να τρέξουμε πρόγραμμα που χρησιμοποιεί όλες τις δυνατότητες του επεξεργαστή (αλλά τότε προς τι η αγορά του).

Ο προβληματισμός μου είναι για τους καλοκαιρινούς μήνες με κάμποσο OC. Οι 69 βαθμοί με +1000mhz τουλάχιστο, +τάση, +35άρες περιβάλλοντος.... μόνο κορυφαία αερόψυκτρα με άριστα αεριζόμενο case, κι αν σε σώζει.

Αυτά επειδή γλυκοκοίταζα τον I7 για το κοντινό μέλλον, αλλά επειδή νερό δεν βάζω και προτιμώ ήσυχη αερόψυξη, θα περιμένω να δω και.... καλοκαιρινά post.

Αλήθεια, αναφέρεται κάπου η μέγιστη αποδεκτή θερμοκρασία λειτουργίας του I7;

Απλά εκφράζω τον - δικαιολογημένο πιστεύω - προβληματισμό μου.

Sorry για το ψιλο-off-topic και την... νεκρανάσταση, αλλά μιας και ψιλοασχολήθηκα με το setάρισμα ενός i7 build που σκοπεύω μετά από καιρό να βάλω σε κάποιο από τα case που έχω παραπεταμένα για μόνιμο μόνιμο rig, είπα επί της ευκαιρίας να βάλω μια screenie :D

i7-920 "high current leakage" edition [ σ.σ. τραβάει απίστευτες τάσεις για συχνότητες άνω των 3.9GHz, για τα 4GHz 24/7 stable εδώ θέλει 1.42V ( πολυμετρημένα, το CPUz εκεί δείχνει 1.408V ) ]

ThermalRight Ultra-120 Extreme ψιλοlapped ( μόνο ένα γρήγορο πέρασμα με ένα 320 Grit s.p. και ακόμα αρκετά στραβή επιφάνεια ) [ θέλει και mod στο bracket μπας και βάλει σωστή πίεση, το μέταλλο γύρω από το socket είναι χαλαρά 15C πιο ζεστό από την βάση της Ultra-120 Extreme lol ] παρέα με έναν Antec 120mm TriSpeed fan @ medium ( μέτριο airflow, αρκετά ήσυχος ) [ για να λέμε την αλήθεια εμποδίζεται και το μισό fan από το dominator airflow που έχω στις μνήμες και εφάπτεται με τον fan στην Ultra-120e ] { από τις λίγες βλακείες που έκανε η Foxconn στην BloodRage, είναι πολύ κοντά στο CPU socket το πρώτο DIMM Slot :( }

HyperThreading On φυσικά, και συνεχές 8 threaded load ( CPU @ 100% all the time ) με το BOINC ( Seti@Home )

28helox.jpg

Κάντε κλίκ στην εικόνα για την original ( full size ) έκδοση :D

Αυτός είναι ο χειρότερος από τους i7 που έχω, και ο πιο ζεστός :D

Link to comment
Share on other sites

Βρε Billy, πολύ ζεστός φαίνεται ο i7. Για μια άλλη παρατήρηση, ποσα δευτερόλεπτα κάνει το timestep στο SETI, για να καταλάβω προσωπικά ποσο γρήγορος είναι ο πυρήνας.

Αν κατάλαβα καλά τι εννοείς, κάθε 1.5μιση με 2 δευτερόλεπτα έχουμε 0.001% progress στα Astropulse πακέτα.

Αν δεν το κατάλαβα καλά, κάνε το λίγο πιο λιανά :D

Όσο για τις temps... ε δεν μπορείς και να τον πείς ζεστό ακριβώς.

Είναι ο πιο ζεστός από τους Core i7 μου αυτός εδώ.

Έχουμε κάνει:

περίπου 16% αύξηση στην τάση λειτουργίας του πυρήνα ( από 1.230V -> 1.424V )

26% αύξηση στην τάση του UnCore ( IMC, L2/L3 Cache, etc ) ( από 1.16V -> 1.46V )

50% αύξηση στην συχνότητα λειτουργίας του επεξεργαστή ( από 2666MHz -> 4002MHz )

85% αύξηση στην συχνότητα του UnCore ( IMC, L2/L3 Cache, etc )

Αν σκεφτείς τώρα ότι έχουμε να κάνουμε με "8 πυρήνες" και με air cooling οι θερμοκρασίες είναι αρκετά καλές, και αν χρησιμοποιούσα τον καλό μου i7 που είναι και πιο κρύο κομμάτι θα ήτανε αρκετά πιο κάτω, αφού χρειάζεται μόλις 1.36V για τα 4GHz.

Idle τώρα το παρόν σύστημα είναι στους 36C/33C/32C/35C με θερμοκρασία δωματίου 20C.

Link to comment
Share on other sites

Αν κατάλαβα καλά τι εννοείς, κάθε 1.5μιση με 2 δευτερόλεπτα έχουμε 0.001% progress στα Astropulse πακέτα.

Απ' οσο θυμάμαι το Seti@Home ήταν πολύ γρήγορο, περίπου 1.5 ώρες / wu

σε έναν opteron170@2.3GHz. Αλλάξανε τα wus ή είναι πολύ αργός ο I7 ?

Link to comment
Share on other sites

Απ' οσο θυμάμαι το Seti@Home ήταν πολύ γρήγορο, περίπου 1.5 ώρες / wu

σε έναν opteron170@2.3GHz. Αλλάξανε τα wus ή είναι πολύ αργός ο I7 ?

Αλλάξανε τα work units κατά πολύ.

Αν θυμάσαι τότες τα work units ήταν περί τα 364kb το καθένα.

Τώρα τα astropulse είναι πιο μεγάλα, ο client αναλύει μεγαλύτερο εύρος συχνοτήτων, και τα work units είναι 8MB το καθένα :D

off-topicz

Στα defaults η ίδια CPU στις ίδιες συνθήκες:

1pjs49.jpg

Και σε full load:

ab1gy.jpg

Link to comment
Share on other sites

Βασικά ο i7 καλός, η Intel με τα στραβά καπάκια ( IHS ) στους Core 2 Duo E6xxx & Core 2 Quad Q6xxx τρέλλανε τις εταιρίες παραγωγής air cooling ψυκτρών, και με την σειρά της μια μούτζα στην κατά τα άλλα κορυφαία ThermalRight που δεν αποφάσισε ακόμα να βγάζει ίσιες τις βάσεις της Ultra-120 Extreme/True Black ενώ εδώ και καιρό πλέον τα καπάκια των Intel είναι σχεδόν ολόισια εως και τέλεια.

Από τις 3 Ultra-120 Extreme και την 1 Ultra-120 που έχω εδώ, δίχως lapping μόνο η Ultra-120 έκανε σχετικά καλή επαφή με τον CPU ( στα defaults full load 67C/66C/68C/64C ) [ σχεδόν χάλια το lappάρισμα που έκανα, και ήδη η διαφορά είναι χαώδης, φανταστείτε να κάνω σωστό lapping { ακόμα και τώρα η επιφάνεια δεν είναι ούτε κατά προσέγγιση επίπεδη } μέχρι να γίνει γυαλί ]

Link to comment
Share on other sites

Archived

This topic is now archived and is closed to further replies.

×
×
  • Δημιουργία...

Important Information

Ο ιστότοπος theLab.gr χρησιμοποιεί cookies για να διασφαλίσει την καλύτερη εμπειρία σας κατά την περιήγηση. Μπορείτε να προσαρμόσετε τις ρυθμίσεις των cookies σας , διαφορετικά θα υποθέσουμε ότι είστε εντάξει για να συνεχίσετε.