Jump to content



AMD Bulldozer Benchmarks Leaked


nikpoth

Recommended Posts

subaru imprezza του 2000 93άλογα γραμμένα 140 μετρημένα με κάτι μικροπιραγματάκια που γίνανε :p

όπως προείπα αλλά κανείς δεν πρόσεξε, μιλάω για τα συγκριτικά. μπορείς να βγεις hammer με 60000€ και ένα πόρσε με 60000€. δεν έχουν ίδια εκκίνηση, ούτε συμπεριφέρονται το ίδιο στο χώμα.

να συγκρίνεις ένα κορβέτ των 60000€ με μία πόρσε των 60000€, αυτό είναι σύγκριση.

το πως όλοι λέγανε ότι το hyperthreading είναι μούφα και δεν κάνει τίποτα στους πυρήνες και είναι κόλπα της ιντελ και τώρα με τις μπουλντόζες να λέτε όλοι (σχεδόν) "o 2600k είναι 4πύρηνος με 8 ενεργά threads", πραγματικά με ανάβει :hehe:

Link to comment
Share on other sites

  • Replies 2,5k
  • Created
  • Last Reply
s

το πως όλοι λέγανε ότι το hyperthreading είναι μούφα και δεν κάνει τίποτα στους πυρήνες και είναι κόλπα της ιντελ και τώρα με τις μπουλντόζες να λέτε όλοι (σχεδόν) "o 2600k είναι 4πύρηνος με 8 ενεργά threads", πραγματικά με ανάβει :hehe:

Γιατί απλά στην περίπτωση της INTEL ανεβάζει τη απόδοση του κάθε πυρήνα από 10% μέχρι 30% σε ορισμένες εφαρμογές και όχι σε όλες !!!

Ενώ όπως το έχει εφαρμόσει η AMD παίζει παντού με απόδοση 80% σε σχέση με 2 ξεχωριστούς πυρήνες !!!

Link to comment
Share on other sites

καταρχήν δεν βγάζω άκρη με αυτό που έγραψες. με 2 ξεχωριστούς πυρήνες....6 8 ή 10 πυρήνες έχει τελικά:wall:

Αρχικά όλοι όσοι είχαν ακούσει για την νέα τεχνολογία της AMD με νέας γενιάς hyperthreading είχαε καταλάβει πως θα έφερνε στην αγορά 8-πύρηνους επεξεργαστές που θα είχαν 16 λογικούς πυρήνες !!! Συμπερασματικά πιστεψαμε πως το module θα ήταν και πυρήνας !!

Σήμερα όμως η AMD ονομάζει το module διπύρηνο και μας λέει πως με 4-module έχεις 8- πυρήνες ....πράγμα που δεν ισχύει 100%

Link to comment
Share on other sites

Αλήθεια το έχετε μπερδέψει το θέμα.

4,8,2,10,16 έχετε αναφέρει όλα τα πολλαπλάσια του 2.

Τελικά πόσους φυσικούς πυρήνες έχουν οι buldozers, (ΦΥΣΙΚΟΥΣ - physical - όχι μαζί με HyperThreading ή οποιαδήποτε άλλη τεχνολογία)

Απλά να το ξεκαθαρίσουμε.

Link to comment
Share on other sites

Γιατί απλά στην περίπτωση της INTEL ανεβάζει τη απόδοση του κάθε πυρήνα από 10% μέχρι 30% σε ορισμένες εφαρμογές και όχι σε όλες !!!

Στις ίδιες εφαρμογές, μην περιμένεις τίποτα τρομακτικά καλύτερο από τους AMD.

Ενώ όπως το έχει εφαρμόσει η AMD παίζει παντού με απόδοση 80% σε σχέση με 2 ξεχωριστούς πυρήνες !!!

Ααα, έχεις δηλαδή επεξεργαστή Bulldozer στα χέρια σου και έχεις τρέξει μετρήσεις ?

Αρχικά όλοι όσοι είχαν ακούσει για την νέα τεχνολογία της AMD με νέας γενιάς hyperthreading είχαε καταλάβει πως θα έφερνε στην αγορά 8-πύρηνους επεξεργαστές που θα είχαν 16 λογικούς πυρήνες !!! Συμπερασματικά πιστεψαμε πως το module θα ήταν και πυρήνας !!

Σήμερα όμως η AMD ονομάζει το module διπύρηνο και μας λέει πως με 4-module έχεις 8- πυρήνες ....πράγμα που δεν ισχύει 100%

Δεν είναι ακριβώς 2 πλήρης πυρήνες το 1 module.

Το design αυτό που πήρε η AMD έχει τα καλά του και τα κακά του.

Όπως π.χ. ότι σε αμιγώς integer based εφαρμογές/αλγορύθμους θα πηγαίνει καλά σε θέμα efficiency, ενώ σε εφαρμογές που παίζουνε πολύ floating point calcs θα πέφτει σχεδόν σε 1core/module performance.

Link to comment
Share on other sites

Όπως π.χ. ότι σε αμιγώς integer based εφαρμογές/αλγορύθμους θα πηγαίνει καλά σε θέμα efficiency, ενώ σε εφαρμογές που παίζουνε πολύ floating point calcs θα πέφτει σχεδόν σε 1core/module performance.

@billpeppas: Αυτό από πού το συμπέρανες? Μπορείς να δώσεις κάποιο reference?

Link to comment
Share on other sites

Ααα, έχεις δηλαδή επεξεργαστή Bulldozer στα χέρια σου και έχεις τρέξει μετρήσεις ?

Η AMD το έχει δηλώσει και όχι εγώ !

Δεν είναι ακριβώς 2 πλήρης πυρήνες το 1 module.

Το design αυτό που πήρε η AMD έχει τα καλά του και τα κακά του.

Όπως π.χ. ότι σε αμιγώς integer based εφαρμογές/αλγορύθμους θα πηγαίνει καλά σε θέμα efficiency, ενώ σε εφαρμογές που παίζουνε πολύ floating point calcs θα πέφτει σχεδόν σε 1core/module performance.

Οχι δεν θα πέφτει σε 1core/module εκτός και αν εκτελεί AVX 256BIT εντολές οπότε και η συνένωση της fpu από 2x128Βιτ είναι απαραίτητη ! Aλλά που χρησιμοποιούμε 256bit εντολές και πόσο συχνά ..... Οτι θα είναι λίγο πιο κάτω θα είναι γιατί τα 2x128bit fmac που αν δεις το block διάγραμμα είναι 4X64ΒΙΤ έχουν κοινό FP SCHEDULER !!! Το θέμα είναι πως δουλεύει αυτός ...

Link to comment
Share on other sites

Η AMD το έχει δηλώσει και όχι εγώ !

Πού ? Link ?

Οχι δεν θα πέφτει σε 1core/module εκτός και αν εκτελεί AVX 256BIT εντολές οπότε και η συνένωση της fpu είναι απαραίτητη ! Οτι θα είναι πιο κάτω θα είναι!!!

Άλλα ντ' άλλων εδώ μας τα λες.

Έχεις την παραμικρή γνώση στο θέμα ή ανακυκλώνεις ότι κοτσάνα μπορεί να έχει γράψει οιοσδήποτε σε κάποιο forum ?

Link to comment
Share on other sites

Το link θα ψάξω να το βρω. Δεν μπορώ να έχω εύκαιρα όλα όσα έχω διαβάσει.

Από εκεί και πέρα σε ότι αφορά την fpu αυτά τα βρήκα μετά από πολλές συζητήσεις σε φόρα και στην oktabit όπου έχει αναλυθεί σχολαστικά το θέμα. Δεν είμαι ο ειδικότερος να κρίνω.

Αν έχεις κάτι να μας διαφωτίσεις εδώ είμαστε να ενημερωθούμε !:)

As for those who think the Bulldozer module is closer to hyperthreading than to two cores, think about what task the Interlagos processor (from which Zambezi is designed from) was designed for. In the server space, Integer performance is more valuable than floating point performance, and while the module may only have one fetch/decode unit, it has two integer execution units. Further, each has their own L1 Data cache, and the L2 cache is able to be dynamically divided amongst the cores in a module (even unfairly). As such, for integer processing, it performs about as well as two cores without any components shared.

As for floating point, there may be only one FPU, but with each cycle, either core can operate on 256 bits of parallel data via two 128-bit instructions or one 256-bit instruction, OR each of the integer cores can execute 128-bit commands simultaneously.

This is actually an advantage over Sandy Bridge, as while Sandy Bridge may also support 256bit AVX instructions, should a program not be programmed to take advantage of those, it is limited to a single 128bit FPU. Further, bear in mind that a 256bit FPU takes up a huge amount of die space, and so sharing it is an important way of saving chip real estate (put it towards the massive L3 cache these chips will have).

AMD "averages" their module design performance by saying that if both cores in a module are active, you'll get around 80% the throughput performance of having two separate cores without any shared resources, but at a significantly lower amount of power consumption. On the other hand, looking at Intel's Hyperthreading, you're lucky to get more than 15% throughput increases on an out-of-order execution processor, but still with a noticeable increase in power consumption. Hyperthreading is much more beneficial on in-order execution processors like the Atom or the Xbox 360s PowerPC CPU, as the pipeline is stalled significantly more often.

For Zambezi at the desktop, one also has to take into consideration how the power saving settings are in the OS (likely configurable by an Administrator). Say a Bulldozer's cores are set up like this (grouped in twos):

12|34|56|78

One can choose from a maximum power saving profile, or a maximum performance profile. Let's say we are executing a program that takes advantage of a quad core, and no additional cores (like many games). If we're interested in maximum power saving, we'd see these cores activated:

12|34

On the other hand, if we're more interested in performance, we'd see this:

1|3|5|7

In the latter case, no resources would be shared (other than L3), and we'd have each individual core running with a full 2MB L2 cache and complete access to the FPU. As most games don't take advantage of more than 4 cores, and because we are enthusiasts here, we'll probably select that option. But others (especially mobile users) will likely opt for the first.

filephpt.jpg

John Fruehe, Director of Product Marketing ( Server/Workstation) AMD

That is exactly what Bulldozer will have.

Each bulldozer core will have its own FPU. In a single cycle you could have:

Thread A: Core 1, 128-bit FPU

Thread B: Core 2, 128-bit FPU

or

Thread A: Core 1, 256-bit FPU

Thread B: Core 2, no FPU

or

Thread A: Core 1, no FPU

Thread B: Core 2, 256-bit FPU

You would never have an execution cycle for a thread that had no FPU unless the core did not need an FPU cycle on that instruction.

For the majority of the workloads, ~90% of what goes on is integer. That means that on most cycles, the FPU is idle anyway. Allowing both to roll to a single core pumps up the FPU on that cycle in the way that is most efficient.

For the heavy FPU workloads, more and more people are looking at GPGPU for even more math work.

http://blogs.amd.com/work/author/jfruehe/

Περιμένω να μου πεις που είναι το λάθος !

Link to comment
Share on other sites

Case 2 & 3:

Core 1 = FPU, Core 2 = No FPU

Ο συσχετισμός που έκανες με την χρήση των εντολών AVX είναι το κυρίως λάθος σου.

Μένει να δούμε στην πράξη τι κάνουνε σε IPC, resource-sharing efficiency σε διάφορες καταστάσεις, overclockability, prices, κατανάλωση.

Link to comment
Share on other sites

τότε η amd έχει πλασάρει μούφα ονομαζόμενους 8πύρηνους.

να το δώσω πιο λιανά. θα είναι κάτι ΣΑΝ (απλά παρομοιάζω πράγματα)

το 1 module θα είναι πχ 2ghz. θα έχει 2 υποmodules.

στην περίπτωση 1 θα δουλεύει το πρώτο υποmodule στα 2Ghz και το δεύτερο θα είναι ανενεργό.

στην περίπτωση 2 θα δουλεύει το δεύτερο υποmodule στα 2Ghz και το πρώτο θα είναι ανενεργό.

στην περίπτωση 3 θα δουλεύουν και τα 2 υποmodules στο 1Ghz.

τουλάχιστον αυτό κατάλαβα μόνο που τα ghz τα είναι η ταχύτητα διαύλου?

Link to comment
Share on other sites

Πωπώ έχασα την μπάλα...

Καθίστε να βγούν και μετά θα φαγωθούμε εκ του ασφαλούς! :dance3:

Για εμένα να περιμένεις ένα 15-20% παραπάνω σε clock to clock & core to core σε σχέση με τους THUBAN .............. Απλά αυτοί θα μπορούν να δουλέψουν σε μεγαλύτερα ρολόγια με την κατανάλωση να παραμένει χαμηλά και θα σου δινουν παραπάνω cores !

Link to comment
Share on other sites

Δεν μπερδεψαμε τιποτα, απλα, τουλαχιστον τον μεγαλο θελουμε να τον συγκρινουμε με τον Core i7 2600 που εχει 4ς πυρηνες αλλα 8 threads (λογο HyperThreading).

Βεβαια δεν εχουμε καμια πληροφορια για το πως θα αποδιδουν οι Bulldozer, ολα βασιζονται σε εικασιες μεχρι τωρα.

Link to comment
Share on other sites

Για εμένα να περιμένεις ένα 15-20% παραπάνω σε clock to clock & core to core σε σχέση με τους THUBAN .............. Απλά αυτοί θα μπορούν να δουλέψουν σε μεγαλύτερα ρολόγια με την κατανάλωση να παραμένει χαμηλά και θα σου δινουν παραπάνω cores !

Κοίτα εμένα με ενδιαφέρει να υπάρχει κάποιος και να τραβάει το αυτί της intel για να πέφτουν οι τιμές και να κερδίζουμε εμείς! :T:

Με το όλο θέμα της μυστικοπάθειας πολύ φοβάμαι οτι κάτι δεν πάει καλά με την πράσινη... :weep:

Και αν κρίνω από αυτά που γράφετε μάλλον οι sandy bridge θα είναι ανταγωνιστικότατοι. Ποιος ξέρει, θα δείξει.

Link to comment
Share on other sites

Archived

This topic is now archived and is closed to further replies.

×
×
  • Δημιουργία...

Important Information

Ο ιστότοπος theLab.gr χρησιμοποιεί cookies για να διασφαλίσει την καλύτερη εμπειρία σας κατά την περιήγηση. Μπορείτε να προσαρμόσετε τις ρυθμίσεις των cookies σας , διαφορετικά θα υποθέσουμε ότι είστε εντάξει για να συνεχίσετε.