GPUs @ 28nm – Q4 2011

savakis · 11 Δεκεμβρίου 2011

Για το αντίπαλο δέος η έκπληξη είναι ότι το εκατόν τέσσερα βρίσκεται τόσο κοντά σε προδιαγραφές που θα εκπλήξει πολλούς.

ελα τωρα άναψες φωτιές, σε παρακαλώ δώσε κάτι ακόμα...

Η 660, το mainstream δηλαδή, περιμένω να είναι πολύ κοντά στην 7950, αν και στο προς τα κάτω.

Έχεις info ότι μπορεί να είναι δίπλα με την 7970;

Για Ιούνιο δεν είναι αυτό?

Psycho_Warhead · 11 Δεκεμβρίου 2011

Λογικά η διαφορά μεταξύ GK104 και Tahiti PRO/7950 θα είναι η ίδια με αυτή των GF114/Cayman Pro(6950) δηλαδή 3-7%(Σε αναλύσεις 1080P με ΑΑ) εκτός και αν τα έχει καταφέρει τόσο καλά η Nvidia ώστε να έχουν ακριβώς το ίδιο Performance.

Λογικά θα είναι κάπως έτσι:

GTX660 =/< HD7950

GTX670 = HD7970

GTX680 Class of its own

GTX690 <> HD7990

savakis · 11 Δεκεμβρίου 2011

Λογικά η διαφορά μεταξύ GK104 και Tahiti PRO/7950 θα είναι η ίδια με αυτή των GF114/Cayman Pro(6950) δηλαδή 3-7%(Σε αναλύσεις 1080P με ΑΑ) εκτός και αν τα έχει καταφέρει τόσο καλά η Nvidia ώστε να έχουν ακριβώς το ίδιο Performance.

Λογικά θα είναι κάπως έτσι:

GTX660 =/< HD7950

GTX670 = HD7970

GTX680 Class of its own

GTX690 <> HD7990

αυτό που λες είναι το λογικό.

ωστόσο αναρωτιέμαι αν η δήλωση του Ailurou σημαίνει κάτι παραπάνω από αυτό...

το gtx 680 θα εμφανιστεί φθινόπωρο, είναι αναμενόμενο να περιμένουμε κάτι τερατώδες μετά από τόσο μεγάλο development stage. και κάτι που μέσα σε 3-5 μήνες από την κυκλοφορία του πιθανόν να βρεθεί αντιμέτωπο με τη δεύτερη γενιά AMD 28nm.... τη σειρά 8***

Το θέμα είναι αν το 660 χτυπάει το 7950 ή το 7970, γιατί αν συμβάινει το δεύτερο περιμένω πόλεμο τιμών... κάτι πολύ καλό για εμάς....

Anubis13 · 11 Δεκεμβρίου 2011

Αιλουρε αν ξερεις: Θα εχει 96 TMUs και 32 ROPS?

Ailuros · 11 Δεκεμβρίου 2011

Back on topic: για να είμαι ειλικρινείς λόγω του ότι το GCN βασίζεται σε ριζικά διαφορετική αρχιτεκτονική από τις προηγούμενες VLiW, οφείλω να ομολογήσω ότι περίμενα και μια αύξηση επάρκειας ανά GFLOP. Nαι μεν καλώς επιτυγχάνει να φτάσει μέχρι και το διπλάσιο των επιδόσεων μιας Cayman, αλλά σε καθαρά τεχνολογική βάση το πως το επιτυγχάνει είναι με 2048 SPs@925 MHz και καταφέρνει έτσι να είναι κατά εκτίμηση 50% σε μέσο όρο γρηγορότερη από μια GTX580 με μόλις 512 SPs@1544 MHz. Φυσικά λογικό και επόμενο τα ALUs είναι ένα μόνο κομμάτι μιας GPU και όχι ο μοναδικός καθοριστικός παράγοντας, ωστόσο αν ισοφαρίσει κανείς τους χρονισμούς μια 580 θα χρειαζόταν θεωρητικά μόνο ~50% παραπάνω ALUs για να ισοφαρίσει τις επιδόσεις μιας Τahiti.

Λογικά με λίγο έξυπνη αριθμητική δεν θα είναι δύσκολο να βρει κανείς πόσες μονάδες και με τι χρονισμούς θα έχει μια GK104.

Αιλουρε αν ξερεις: Θα εχει 96 TMUs και 32 ROPS?

H 7970? 128 TMUs, για τα ROPs δεν θυμάμαι καλά τα στοιχεία των slides αλλά νομίζω 64. Το τελευταίο είναι κατά την ταπεινή μου άποψη απόλυτη υπερβολή για μια τέτοια κάρτα.

Psycho_Warhead · 11 Δεκεμβρίου 2011

1544Mhz ????

Ailuros · 11 Δεκεμβρίου 2011

1544Mhz ????

Για το GK104; Αν ναι, δεδομένου ότι η 560Ti@40nm ξεπέρασε τα 1.6 θα έλεγα να είσαι λίγο πιο γενναιόδωρος με τα 28nm. Φυσικά και παραπάνω μονάδες από την 580. Περισσότερες λεπτομέρειες όταν έρθει η ώρα του.

Psycho_Warhead · 11 Δεκεμβρίου 2011

Εντωμεταξύ είχα γράψει 128 ROPs ενώ είναι 128 TMUs

Ailuros · 11 Δεκεμβρίου 2011

Εντωμεταξύ είχα γράψει 128 ROPs ενώ είναι 128 TMUs

Η ΑΜD το cluster ή SM το έχει ονομάσει CU (compute unit). ΄Εχεις 32 CUs με 4 TMUs ανά CU και με τα ROPs βάζεις ή βγάζεις θεωρητικά όσα θέλεις μιας και δεν είναι συνδεδεμένη με τον ελεγκτή μνήμης να πρέπει να έχεις ανά ROP partition (64bit) 8 ROPs.

savakis · 11 Δεκεμβρίου 2011

Back on topic: για να είμαι ειλικρινείς λόγω του ότι το GCN βασίζεται σε ριζικά διαφορετική αρχιτεκτονική από τις προηγούμενες VLiW, οφείλω να ομολογήσω ότι περίμενα και μια αύξηση επάρκειας ανά GFLOP. Nαι μεν καλώς επιτυγχάνει να φτάσει μέχρι και το διπλάσιο των επιδόσεων μιας Cayman, αλλά σε καθαρά τεχνολογική βάση το πως το επιτυγχάνει είναι με 2048 SPs@925 MHz και καταφέρνει έτσι να είναι κατά εκτίμηση 50% σε μέσο όρο γρηγορότερη από μια GTX580 με μόλις 512 SPs@1544 MHz. Φυσικά λογικό και επόμενο τα ALUs είναι ένα μόνο κομμάτι μιας GPU και όχι ο μοναδικός καθοριστικός παράγοντας, ωστόσο αν ισοφαρίσει κανείς τους χρονισμούς μια 580 θα χρειαζόταν θεωρητικά μόνο ~50% παραπάνω ALUs για να ισοφαρίσει τις επιδόσεις μιας Τahiti.

Λογικά με λίγο έξυπνη αριθμητική δεν θα είναι δύσκολο να βρει κανείς πόσες μονάδες και με τι χρονισμούς θα έχει μια GK104.

H 7970? 128 TMUs, για τα ROPs δεν θυμάμαι καλά τα στοιχεία των slides αλλά νομίζω 64. Το τελευταίο είναι κατά την ταπεινή μου άποψη απόλυτη υπερβολή για μια τέτοια κάρτα.

λογικά κάπου στους 768 sp's θα έχει το 104. αυτό βέβαια είναι 50% πάνω από την 580, κάτι που βάζει το 104 ανάμεσα στην 7950 και την 7970.

Πάντως η nvidia από σε 8800 σε 280 και μετά σε 480 έχασε λίγο σε δύναμη ανά sp στην ίδια συχνότητα. από 480 σε 580 αυτό δεν έγινε... οπότε αναμένουμε....

Anubis13 · 11 Δεκεμβρίου 2011

H 7970? 128 TMUs, για τα ROPs δεν θυμάμαι καλά τα στοιχεία των slides αλλά νομίζω 64. Το τελευταίο είναι κατά την ταπεινή μου άποψη απόλυτη υπερβολή για μια τέτοια κάρτα.

Πολυ ενδιαφερον. Διαβαζα αυτο το πολυ ενδιαφερον πσοτ που με εβαλε σε σκεψεις.

http://forums.anandtech.com/showpost.php?p=32692071&postcount=403

Ποια η αποψη σου?

Ailuros · 11 Δεκεμβρίου 2011

Πολυ ενδιαφερον. Διαβαζα αυτο το πολυ ενδιαφερον πσοτ που με εβαλε σε σκεψεις.

http://forums.anandtech.com/showpost.php?p=32692071&postcount=403

Ποια η αποψη σου?

Κάθε IHV πριν πάει να συλλάβει την ιδέα μια καινούργιας αρχιτεκτονικής βάζει κάτω τις εκάστοτε λεπτομέρειες και βλέπει που έχουν προτερήματα και που αδυναμίες. Γιατί το να πετύχει κάποιος την τέλεια GPU είναι φύση αδύνατο.

Ωστόσο το GCN/SI δεν παύει να είναι μια εντελώς διαφορετική αρχιτεκτονική από τις προηγούμενες VLiW και η όλη υπόθεση δύσκολα λύνεται με τόσο απλοποιημένα μαθηματικά. Σε αντίθετη περίπτωση θα είχαν κρατήσει τις VLiW4 θα είχαν βάλει απλά 128 ΤΜUs, 64 ROPs και τον 384-μπιτο δίαυλο και θα είχαν ξεμπλέξει...αμ δε. Μην ξεχνάς ότι το GCN είναι πολύ πιο προσανατολισμένο και στις επαγγελματικές αγορές και έχει και πολύ επαρκέστερο tessellation. Για την mainstream desktop αγορά μια 7970 θεωρητικά θα πρέπει να δίνει μια στάλα λιγότερο από 1 TFLOP double precision (η διπλάσια αναλογία από ότι σε GF1xx όπου το έχουν περιορίσει εσκεμμένα στο 1/8).

Σε στείρες αριθμητικές αναλογίες ναι σε GFLOPs η Τahiti προσθέτει περίπου 44% σε σύγκριση με το Cayman και σε εύρος μνήμης 83% δηλαδή σχεδόν το διπλάσιο. Ούτε η άνοδος του texel ρυθμού πλήρωσης πρέπει να προυποθέτει τόσο περισσότερο εύρος αλλά ούτε ο pixel ρυθμός πλήρωσης μόνο. Αυτό που τείνουμε πολλοί να ξεχνάμε είναι ότι μια GPU αποτελείται από μια πλειάδα διαφορετικών μονάδων. Υπεραπλουστευμένα το όλο σύνολο χρειαζόταν τόσο παραπάνω εύρος μεταξύ αυτών και τα ALUs.

Για τις μελλοντικές γενιές και αν το GDDR-Next δεν αποδειχτεί επαρκέστερο του 5 θα χρειαστούν οι IHV επαναστατικές πηγές εύρους μνήμης. 384 μπιτοι δίαυλοι για performance GPUs για αυτόν το γύρο και 512-μπιτοι για high end single chip.

λογικά κάπου στους 768 sp's θα έχει το 104. αυτό βέβαια είναι 50% πάνω από την 580, κάτι που βάζει το 104 ανάμεσα στην 7950 και την 7970.

Παράγοντες που θα ίσως τοποθετήσουν μια 104 στο επίπεδο μιας 7950 περίπου (ή και παραπάνω)θα είναι ο χρονισμός πυρήνα, ο αριθμός των ROPs και το εύρος μνήμης μεταξύ άλλων.

Πάντως η nvidia από σε 8800 σε 280 και μετά σε 480 έχασε λίγο σε δύναμη ανά sp στην ίδια συχνότητα. από 480 σε 580 αυτό δεν έγινε... οπότε αναμένουμε....

H 480 είχε την τεράστια ατυχία να έχει το πρόβλημα το interdie connect (πράγμα που εξήγησε επίσημα ο Jensen με μια απλούστευση δημόσια). To GF100 δεν μπόρεσε ποτέ να φτάσει τους χρονισμούς που είχαν σαν στόχο γιατί σε συνδυασμό με την ενεργοποίηση και του 16ου SM θα εκτόξευε την κατανάλωση ρεύματος σε επίπεδα απαγορευτικά. To GF110/580 ήταν ουσιαστικά μια στάλα παραπάνω από ότι προόριζε η NV την 480/GF100 και απουσία 32nm τόσο η NV όσο και η AMD αναγκάστηκαν να μείνουν στα 40nm και να καταπιούν το πικρό χάπι της ακόμα υψηλής κατανάλωσης ρεύματος.

Σαν αρχιτεκτονική ωστόσο το Fermi παρότι ανέβηκε λίγο κουτσαίνοντας στην σκηνή είναι πάρα πολύ καλή και σαν βάση μπορεί να τους κρατήσει αρκετές γενιές ακόμα. Την μόνη ουσιαστικότερη αλλαγή που ίσως δούμε μπορεί να είναι η κατάργηση των hotclocks αρχής γενομένης με το Echelon, αλλά καλώς εχόντων των πραγμάτων απέχει το λιγότερο 4 χρόνια ακόμα.

Anubis13 · 12 Δεκεμβρίου 2011

Kαταστοπιτικότατος.

Ailuros · 12 Δεκεμβρίου 2011

Kαταστοπιτικότατος.

Πριν το ξεχάσω νομίζω ότι το Tahiti XT έχει σχεδόν 5MB σε caches, ρεκόρ ποσότητας cache μέχρι να εμφανιστεί το high end Kepler. Yπεραπλουστευμένα όσο περισσότερο cache μπορείς να έχεις σε έναν τέτοιο πυρήνα, τόσο περισσότερα δεδομένα μπορούν να μείνουν on chip και να εξοικονομήσουν αρκετό bandwidth. ΄Οσο περισσότερα δεδομένα ταξιδεύουν από τον πυρήνα στην μνήμη τόσα περισσότερα reads/writes και υψηλότερη κατανάλωση εύρους.

Psycho_Warhead · 12 Δεκεμβρίου 2011

Είμαι περίεργος να μάθω το TDP του High-End Kepler..

Γύρω στα 250W το κόβω..

Σύνδεση

GPUs @ 28nm – Q4 2011

Προτεινόμενες αναρτήσεις

savakis

Συχνή συμμετοχή στο θέμα

Δημοφιλείς Ημέρες

Συχνή συμμετοχή στο θέμα

Δημοφιλείς Ημέρες

Psycho_Warhead

savakis

Anubis13

Ailuros

Psycho_Warhead

Ailuros

Psycho_Warhead

Ailuros

savakis

Anubis13

Ailuros

Anubis13

Ailuros

Psycho_Warhead

Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε

Δημιουργία λογαριασμού

Σύνδεση

Σύνδεση