Jump to content

Γιατί 2χ 5770 cf είναι καλύτερες απο μια 5870;


Volrath
 Share

Recommended Posts

Άμα έχεις αϋπνίες, κάθεσαι και ψυρίζεις τα πάντα. Χάζεβα benchs για 5770 cf και έβλεπα σε πολλές περιπτώσεις ότι είναι γρηγορότερες από μια 5870. Στην αρχή δεν έδωσα σημασία, αλλά μετά με "χτύπησε".

241sgu1.jpg

Όπως βλέπουμε η 5770 ουσιαστικά είναι "μισή" 5870. Έχει τους μισούς shaders/TMU/ROPS ακριβώς.

Σε έναν καθαρά θεωρητικό κόσμο, η 5770 θα είχε ΑΚΡΙΒΩΣ την μισή απόδοση από μια 5870.

2x 5770 σε crossfire δε, ακόμα και τελείως θεωρητικά, δε θα μπορούσαν να αγγίξουν το επίπεδο μιας 5870, αφού έχουν κουτσουρεμένο bus width. (Δε δουλεύει αθροιστικά στο cf, είναι παρόμοια κατάσταση με το μέγεθος της μνήμης - πχ, 2 κάρτες με 1gb ram σε cf έχουν πάλι 1gb ram, όχι 2).

Τι γίνεται εδώ πέρα;

-Θέμα drivers; Πολύ χλωμό να έχει καλύτερη υποστήριξη στους drivers το cf από ότι single κάρτα.

-Bottleneck στο 16χ pci-e για την 5870; Επίσης χλωμό, δοκιμές έδειξαν ότι το 8x με το 16x έχουν 5%-10% διαφορά στην 5870 οπότε το 16x μπορεί να καλύψει τουλαχιστον 1.8 φορές το bandwidth που θέλει η 5870.

-Παγκόσμια συνωμοσία; Επίσης χλώμό, ρώτησα Λιακόπουλο.

Το μόνο που μπορώ να συμπεράνω είναι ότι τελικά, είτε ο σχεδιασμός του cypress κάπου δημιουργεί εσωτερικό bottleneck, το οποίο δεν υπάρχει στο juniper, είτε ειναι καλύτερα σχεδιασμένο το pcb στο τελευταίο.

Δικές σας απόψεις;

edit: Εχετε υπ΄οψιν σας, ότι και οι 2 κάρτες έχουν ακριβώς την ίδια αρχιτεκτονική.

Edited by Volrath
  • Like 2
Link to comment
Share on other sites

Πιστευω ο λόγος είναι ανάλογος αυτού για τον οποίο δουλέυει πρακτικά και το HyperThreading.

Κάποιες εντολές ενω σε single chip μπαίνουν σε queue και δε μπορούν να εκτελεστούν ταυτόχρονα σε dual configuration εκτελούνται απο διαφορετική κάρτα οπότε έχεις πιο γρήγορα αποτελέσματα.

Link to comment
Share on other sites

Πιστευω ο λόγος είναι ανάλογος αυτού για τον οποίο δουλέυει πρακτικά και το HyperThreading.

Κάποιες εντολές ενω σε single chip μπαίνουν σε queue και δε μπορούν να εκτελεστούν ταυτόχρονα σε dual configuration εκτελούνται απο διαφορετική κάρτα οπότε έχεις πιο γρήγορα αποτελέσματα.

Μα μια gpu ειναι τελειως παραλληλη αρχιτεκτονικη, δεν μoιαζει με το hyperthreading.

Link to comment
Share on other sites

Παίζει να οφείλεται στην μνήμη... τα i/o της μνήμης μεταξύ cpu <-> gpu είναι τόσο αργά, που σε cf setups τα i/o είναι τα μισά, άρα και πολύ μικρότερος ο χρόνος που απαιτείται για την συνολική διαδικασία... άσχετα με το πόσο δυνατή είναι η cpu έχει bottleneck την μεταφορά δεδομένων από και προς την ram του συστήματος, όπως ακριβώς και η cuda της nvidia...

Link to comment
Share on other sites

Όταν λες μνήμη, εννοείς την βασική, ή της VGA;

Γιατί, άμα μιλάμε για την πρώτη περίπτωση ο συνολικός αριθμος των Ι/Ο παραμένει ίδιος, και επεξεργάζονται και στις 2 περιπτώσεις (cf vs single) από το southbridge. (νομίζω δλδ, εκτός τον περιπτώσεων που μιλάμε για gpgpu).

Τώρα άμα μιλας γενικά για traffic από vga ram->pci-e->southbridge->cpu, τοτε μη ξεχνάς ότι η 5770 έχει ήδη μειονέκτημα από το μειωμένο bandwidth του bus.

(Ελπίζω να μη λέω αρλούμπες, αλλά έτσι το καταλαβαίνω.)

Link to comment
Share on other sites

To ότι αποδίδει καλύτερα η 5770 από μισή-5870 πιστεύω ότι οφείλεται στο ότι είναι πιο δύσκολο να "δουλέψεις/τροφοδοτίσεις/μοιράσεις" 20 SIMDS (cores) από ότι 10 SIMDS που έχει η 5770.

Ακόμα και στα cpus το βλέπουμε αυτό πχ http://img12.imageshack.us/ifs/7466/img44/4/phenomii955cinebenchx64.jpg

Αν βάζανε 256bit interface στις 5770 θα κόβανε πολλές πωλήσεις από τις 5850/4890.

Link to comment
Share on other sites

Όταν λες μνήμη, εννοείς την βασική, ή της VGA;

Οι gpu συνήθως επεξεργάζονται τα δεδομένα φορτώνοντας vectors από την μνήμη (ram) της cpu στην video ram (η οποία είναι shared για όλες τις gpu μέσα στην κάρτα)... στην συνέχεια φορτώνει η cpu μέσω της ram, τον κώδικα που πρέπει να τρέξει η gpu για να επεξεργαστεί τα vectors... αυτή η διαδικασία της μεταφοράς είναι πολύ αργή σε σχέση με την επεξεργασία και αν μπει και στην εξίσωση το overhead από τα πάμπολα apis που κάνουν wrap το ένα το άλλο (πχ η μηχανή γραφικών έχει ένα σωρό wrappers για τα dx που υποστηρίζει) και τα οποία εμπλέκονται στην διαδικασία και απασχολούν cpu time (και σε πολλές περιπτώσεις δεν υποστηρίζουν και multi-threading), τότε δημιουργείται ένα lag... αυτό το lag ανάλογα με τον όγκο δεδομένων μπορεί να είναι μεγάλο, παρόλο που στην πραγματικότητα η gpu δεν ζορίζεται...

Edit: Επίσης όταν μεταφέρονται δεδομένα από την cpu στην gpu, επειδή είναι ένα από ανώτερα irq, δεν δουλεύει τίποτα άλλο... σχεδόν όλοι περιμένουν να τελειώσουν...

Edited by Jaco
Link to comment
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now
 Share

×
×
  • Create New...