Jump to content



CPU FLOPS - QwikMark - Bench NOW !


Recommended Posts

Παίδες επειδή όλα ωραία και καλά τα bench αλλά κάτι για να μετρήσουμε πόσα Flops μπορεί να κάνει ο cpu μας δεν έχω δει πουθενά !

οπότε με το παρακάτω προγραμματάκι

QwikMark 0.4

(εδιτ για τους δύσπιστους από δω πήρα τον σύνδεσμο για το κατέβασμα http://www.vtaskstudio.com/support.php#tools )

το κατεβάζεται το ανοίγεται και τρέχετε το CPU FLOPS και το ΜΕΜ Βandwidth

την αρχή την κάνω εγώ βάζοντας τον ι7 920 μου :hehe:

attachment.php?attachmentid=55210&stc=1&d=1363450565

EDIT

Μετά από χιλιάδες emails κάνω μία μικρή αναδρομή να δούμε τι είναι τα FLOPS

FLOPS , Floating-point Operations per Second

OR

ΠΚΥΑΔ, Πράξεις Κινητής Υποδιαστολής Ανά Δεύτερο

Πράξεις κινητής υποδιαστολής ανα δεύτερο. Πρόκειται για ένα αμφιλεγόμενο κριτήριο μέτρησης της ταχύτητας των μικροεπεξεργαστών. Αφορά τον αριθμό των κλασματικών ή δεκαδικών πράξεων που εκτελεί μικροεπεξεργαστής σε ένα δευτερόλεπτο. Οι υπολογισμοί με κλασματικούς και δεκαδικούς αριθμούς είναι πιο πολύπλοκοι από τους υπολογισμούς με ακέραιους. Το συνηθισμένο επίπεδο μετρήσεων είναι σε ΜεγαΠΚΥΑΔ , (Εκατομμύρια Πράξεις Κινητής Υποδιαστολής Ανα Δεύτερο, Megaflops) και ΓίγαΠΚΥΑΔ (Δισεκατομμύρια Πράξεις Κινητής Υποδιαστολής Ανα Δεύτερο, Gigaflops).

Οι σημερινοί μικροεπεξεργαστές συμπεριλαμβάνουν και ειδική Μονάδα Κινητής Υποδιαστολής για τέτοιους υπολογισμούς. Ακριβώς λόγω της ύπαρξης αυτής της μονάδας το κριτήριο ταχύτητας ΠΚΥΑΔ αμφισβητείται καθότι σημαντικό είναι η συνολική ταχύτητα του μικροεπεξεργαστή λαμβανόμενων υπ’ όψη και άλλων παραμέτρων.

Πως υπολογίζεται
One can calculate FLOPS using this equation:[1]

868abd36d3efa27939c0204cee8d9e67.png or

fede3df8fbbb36650e89a724c6ae0fe3.png Most microprocessors today can do 4 FLOPs per clock cycle. Therefore a single-core 2.5-GHz processor has a theoretical performance of 10 billion FLOPS = 10 GFLOPS.

ΒΥ -- Dr. Mark R. Fernandez, Ph.D.

In the past, a chassis contained a single node. This chassis was a desktop computer or a tower version or a deskside unit or a rack-mounted pizza box server, etc. Within that thing you bought was a single node. A single node contained a single processor. A processor contained a single (CPU) core and fit into a single socket. But times change...

With recent "systems,” we can have a single chassis containing multiple nodes. And those nodes contain multiple sockets. And the processors in those sockets contain multiple (CPU) cores.

Therefore, let’s define a few terms.

1. A "chassis" houses one or more nodes.

2. A node contains one or more sockets.

3. A socket holds one processor.

4. A processor contains one or more (CPU) cores.

5. The cores perform FLOPS.

The "chassis" is that thing that houses one or more compute nodes. Note that the chassis may be a rack-mounted pizza box, or a blade enclosure or entire rack computer, which accepts plug-in compute nodes. One must buy one or more of these in order to have a computer system. Nonetheless, I call the piece of hardware that is a unit that houses compute nodes a chassis.

Nodes, usually a printed circuit board(s) of some type, are manufactured with (empty) sockets. There is not, in general, a node board for each available processor. The node boards are built to accommodate a family of processors. Depending upon your needs, your desires, or your budget, you select a specific processor to go into that socket. Today, within the same processor family, you can select between differing core counts, a wide range of frequencies and vastly differing memory cache structures.

Also note that the "thing" that Intel and AMD and other microprocessor companies sell is a processor. One cannot buy anything smaller than a processor. And they call it a processor with preceding adjectives, e.g., the ABC dual-core processor, or the XYZ quad-core processor.

Finally, the cores within the processor perform the actual mathematical computations. One sequence of these mathematical operations involves the exclusive use of floating point numbers and is called a FLOP or FLoating-point OPeration. The plural of FLOP is FLOPs, with a small “s,” like many things when made plural.

In general, a core can do a certain number of FLOPs or FLoating-point OPerations every time its internal clock ticks. These clock ticks are called cycles and measured in Hertz (Hz). Most microprocessors today can do four (4) FLOPs per clock cycle, that is, 4 FLOPs per Hz. Thus, depending upon the Hz frequency of the processor’s internal clock, the floating point operations per second or FLOPS can be calculated. Note the large “S” in FLOPS.

The internal clock speed of the core is known. It’s that GHz rating typical of today’s processor. For example, a 2.5-GHz processor ticks 2.5 billion times per second (Giga ~ billion). Therefore, a 2.5-GHz processor ticking 2.5 billion times per second and capable of performing 4 FLOPs each tick is rated with a theoretical performance of 10 billion FLOPs per second or 10 GFLOPS.

That’s probably more than anyone needs to know about the details of counting mathematical operations done by microprocessors. Fortunately, the final formula for computing theoretical performance of a system is quite simple and straightforward.

Here is a full and complete sample formula using dimensional analysis:

GFLOPS = #chassis * #nodes/chassis * #sockets/node * #cores/socket * GHz/core * FLOPs/cycle

Note that the use of a GHz processor yields GFLOPS of theoretical performance. Divide GFLOPS by 1000 to get TeraFLOPS or TFLOPS.

Likewise, MHz clocks used in the formula will yield MFLOPS, if you need that number. Similarly divide MFLOPS by 1000 to get GFLOPS. When might you need MHz these days, you ask? Think GPU speeds.

Note that for multi-rack systems, the formula may be improved by adding the number of chassis per rack as the first term.

Hope this helps.

-- Dr. Mark R. Fernandez, Ph.D.

Σημείωση

In energy cost, according to the Green500 list, as of June 2011 the most efficient TOP500 supercomputer runs at 2097.19 MFLOPS per watt. This translates to an energy requirement of 0.477 watts per GFLOPS, however this energy requirement will be much greater for less efficient supercomputers.

post-14318-1416077150,2335_thumb.jpg

Link to comment
Share on other sites

  • Replies 56
  • Created
  • Last Reply
Το CPU usage ήταν μόνο στο 30%. Κάνω κάτι λάθος ή σε όλους τα ίδια κάνει;

Κι εγώ μέχρι 17% είδα οπότε δεν κάνεις τίποτα λάθος.

Μάλλον το intel burn test που μετράει κι αυτό gflops είναι πιο αξιόπιστο.

Link to comment
Share on other sites

[MENTION=3128]2cpu[/MENTION]

[MENTION=14026]jiohkor3[/MENTION]

Γιατί τόσο χαμηλά το memory bandwidth?

Εμενα παντως ειναι ολα default οσο θυμαμαι.Το μονο που ισως αν εκανα

ηταν κλικ ταχυτητα στα 1600 (αν το εκανα κιολας save & exit).

[MENTION=4171]deninho[/MENTION]

17% αντε να χτυπησε 18% για μερικα κλασματα .

post-3128-1416077153,7904_thumb.jpg

Link to comment
Share on other sites

Archived

This topic is now archived and is closed to further replies.

×
×
  • Δημιουργία...

Important Information

Ο ιστότοπος theLab.gr χρησιμοποιεί cookies για να διασφαλίσει την καλύτερη εμπειρία σας κατά την περιήγηση. Μπορείτε να προσαρμόσετε τις ρυθμίσεις των cookies σας , διαφορετικά θα υποθέσουμε ότι είστε εντάξει για να συνεχίσετε.