Προς το περιεχόμενο

Nvidia GT300 & ATI RV870


Thresh

Προτεινόμενες αναρτήσεις

Δημοσ.

Χαιρετώ, εάν καταλαβαίνω καλά από αποσπασματικό διάβασμα στο διαδίκτυο, η επόμενες γενεές GP/GPU αναμένονται προς το τέλος της χρονιάς τέλη q3 και τελικά ίσως q4.

 

---------- Το μήνυμα προστέθηκε στις 17:02 ----------

 

Άσχετο αλλά μιας και είχα κάτι γράψει παλιότερα περί modular. Περιμένω την nvidia να βγάλει σταδιακά και μια έκδοση φουσκωμένου gt200 με παραπάνω διαθέσιμη local μνήμη ανά sp και άλλα καλούδια για την επαγγελματική αγορά (non-gamers).

Όταν έλεγα για πλατφόρμα εννοούσα πραγματικά κάρτα-πλατφόρμα. Λ.χ. zif socket for GP/GPU-core, upgradable ram modules, special broadcasting modules, modules για video out όλων των ειδών κ.ο.κ.

Γενικά άσχετο με το τι θα κάνει, η επαγγελματική αγορά χρειάζεται features τα οποία δεν είναι σίγουρο ότι τα χρειάζονται εξίσου οι gamers. Ως τώρα το οικονομικό βάρος για την ανάπτυξη αντίστοιχων features το έχει πληρώσει κύρια ο gamer-καταναλωτής.

 

Διαφορετικά, η ati με πιο μικρούς πυρήνες που περισσότερο στοχεύουν την gamer αγορά παρά την HPC είναι λογικό να βγάζει κάρτες με μεγαλύτερο περιθώριο κέρδους. (λιγότερα fetures -> μικρότερος πυρήνας). Ας μην ξεχνάμε όμως ότι και η ati μπορεί να κάνει την έκπληξη με αρχιτεκτονικά features που θα είναι κομμένα και ραμμένα για τις ανάγκες HPC.

 

Αντίστοιχο διαχωρισμό έχουμε να δούμε χρόνια από τις εταιρίες αυτές σε hardware. Αλλά μην ξεχνάμε ότι λ.χ. η matrox βγάζει κάρτες για άλλες αγορές, και υπάρχουν και αρκετές εταιρίες που πουλάνε (πολύ) ακριβά επιταχυντές / co-processors.

  • Απαντ. 2,9k
  • Δημ.
  • Τελ. απάντηση
Δημοσ.

Πριν πάω σε οτιδήποτε άλλο για να αποφύγουμε παρεξηγήσεις στο PM εννοούσα κατά 15% λιγότερη κατανάλωση ρεύματος και όχι το 15% της 285.

 

Χαιρετώ, εάν καταλαβαίνω καλά από αποσπασματικό διάβασμα στο διαδίκτυο, η επόμενες γενεές GP/GPU αναμένονται προς το τέλος της χρονιάς τέλη q3 και τελικά ίσως q4.

 

Eξαρτάται πότε θα στρώσουν τα TSMC 40G yields και η διαθεσιμότητα GDDR5 μνήμης στα 1100MHz.

 

Διαφορετικά, η ati με πιο μικρούς πυρήνες που περισσότερο στοχεύουν την gamer αγορά παρά την HPC είναι λογικό να βγάζει κάρτες με μεγαλύτερο περιθώριο κέρδους. (λιγότερα fetures -> μικρότερος πυρήνας). Ας μην ξεχνάμε όμως ότι και η ati μπορεί να κάνει την έκπληξη με αρχιτεκτονικά features που θα είναι κομμένα και ραμμένα για τις ανάγκες HPC.

 

Υπολογίζω ότι η διαφορά αυτή την φορά δεν θα είναι τόσο μεγάλη όσο σήμερα. Να ξεκινήσουμε από το γεγονός ότι αμφότερες εταιρίες πλέον παρασκευάζουν στα 40nm και αμφότερες χρησιμοποιούν GDDR5. Aπό κει και πέρα αν τα μέχρι τώρα δεδομένα ισχύουν τότε υπολογίζω:

 

GT200--->G300 = increase in theoretical arithmetic throughput by 2.7x

RV770X2-->RV870X2 = increase in theoretical arithmetic throughput by 1.9x

 

΄Οσων αφορά το μέγεθος του πυρήνα οι μπακαλο-υπολογισμοί μου δεν πέσουν έξω το προτέρημα της ΑΤΙ όσων αφορά τα τετραγωνικά χιλιοστά ίσως να μειωθεί γύρω στα 20%.

 

Αυτό με το περιθώριο κέρδους αδυνατώ να το καταλάβω. Αν εννοείς το κόστος κατασκευής ανά πυρήνα όταν πουλάς μια επαγγελματική κάρτα με τιμή μερικές χιλιάδες ευρώ σε νοιάζει αν σου στοιχίζει ο κάθε πυρήνας 50 ή 100€ στην παρασκευή του. ΄Οταν το ποσοστό της NV κυμαίνεται ανάμεσα στα 80 και μέχρι 90+% αναλογία αυτής της αγοράς είναι γελοίο και να το συζητάμε. Με την εμφάνιση της κρίσης και τις RV7x0 FireGL ανέβηκε το ποσοστό αγοράς της ΑΤΙ από τα 8 στα 12%. Ναι είναι 50% αύξηση αλλά εξακολουθεί να είναι ψίχουλα έναντι του 85% του ανταγωνισμού.

 

 

Δημοσ.

Ailouros, καλά κάνεις και υπενθυμίζεις ότι η nvidia κατέχει μεγάλο ποσοστό στις επαγγελματικές. Απλά δεν έχω ψάξει τα ποσοστά εσόδων ανά αγορά.

 

Larrabee-Die.JPG

 

Το παραπάνω πιθανότατα είναι ένας Larabee.

Στο B3D (και αλλού) έγινε και μια πρώτη προσπάθεια να βγάλουν κάνα λαβράκι από τη φωτογραφία… Πιθανολογείται ότι πρόκειται για 32 core με cache, 4 memory controllers/routes, 8 texture units.

Αναμένεται q1 2010

Δημοσ.

Αν συνεχίσει τις παπάντζες όμως όπως καλή ώρα με την σειρα 8000Μ, που ήταν υπεύθυνη για χιλιάδες νεκρά λάπτοπ, θα πάει άπατη.

Αν μια εταιρία χάσει την αξιοπιστία της τότε πάει για λουκέτο.

  • Super Moderators
Δημοσ.

συμβαίνει και στις καλύτερες οικογένειες...

 

στις "desktop" κάρτες πάντως δεν υπήρχε πρόβλημα...

Δημοσ.
Ailouros, καλά κάνεις και υπενθυμίζεις ότι η nvidia κατέχει μεγάλο ποσοστό στις επαγγελματικές. Απλά δεν έχω ψάξει τα ποσοστά εσόδων ανά αγορά.

 

Τι ποσοστά εσόδων να δεις όταν η ΑΤΙ κυρίως περιορίζεται σε ένα 12% (κυρίως workstation και ουχί servers) έναντι 85% (αν θυμάμαι τα τελευταία ποσοστά καλά. Οι FireGL είναι αντίστοιχες των Quadro, για τις Tesla τι έχουν; Πέραν τούτου αν εξαιρέσεις και το CUDA ακόμα και ρωτήσεις έναν επαγγελματία ποιός έχει πιο ολοκληρωμένη υποστήριξη λογισμικού φαντάζομαι ότι θα ξέρεις την απάντηση.

 

 

Larrabee-Die.JPG

 

Το παραπάνω πιθανότατα είναι ένας Larabee.

Στο B3D (και αλλού) έγινε και μια πρώτη προσπάθεια να βγάλουν κάνα λαβράκι από τη φωτογραφία… Πιθανολογείται ότι πρόκειται για 32 core με cache, 4 memory controllers/routes, 8 texture units.

Αναμένεται q1 2010

 

8 ΤMUs αποκλείεται να' ναι LOL.

Δημοσ.

Μάλιστα…

Εντυπωσιακό…

 

Όσο για την όποια δομή του intel… αυτή τη στιγμή καθένας γράφει το κοντό και το μακρύ του ακόμα και στο realworltechnologies…

Δημοσ.

΄Αλλο TMU και άλλο TMU cluster. Aν υποθετικά έχει 8 TMUs/TMU cluster τότε θα έχει 64 TMUs. Περισσότερο από μια λύση mainstream δεν θα περίμενα για desktop LRB. Δεν βάζω καθόλου το χέρι μου στην φωτιά αλλά λογικά περιμένω κάτι ανάλογο:

 

Performance:

 

G300 --> RV870 --> LRB

 

Die area:

 

G300 --> LRB --> RV870

 

Power consumption:

 

LRB --> G300/RV870

Δημοσ.

Και μια και οι διάφορες ιστοσελίδες προκόψανε και βγάλανε στην φόρα τα στοιχεία που κυκλοφορούν στο παρασκήνιο εδώ και αρκετές εβδομάδες έχουμε και λέμε:

 

G300/GT300/NV70 (ή όπως στον κόρακα το καλούνε τελικά εσωτερικά)=

 

495mm2@40nm

2.4 B Transistors

512 SPs (MADD+MUL/SP?) @ 1600MHz

128 TMUs(?) @700MHz

1100MHz GDDR5@512bit

 

Αν πάρουμε τα 512SPs σαν δεδομένο, διαιρείται μόνο με 8, 16, 32.

 

8 clusters θα ήταν μάλλον κακή ιδέα γιατί θα σήμαινε 8 SPs/ cluster και άρα [8*(8*8)]. Μια λογικότερη εναλλακτική λύση θα ήταν [8*(16*4)] όπου θα μιλάγαμε για 8 clusters με Vec4 16 SIMDs. Eπειδή όμως είναι σίγουρος ότι διατήρησαν τα 1D ALUs χάρην backwards compatibility (CUDA & co.) δεν παίζει τέτοιο σενάριο.

 

32 clusters θα σήμαινε [32*(2*8)] που θα σήμαινε επιστροφή στο G80 σενάριο και εκτός του ότι συνήθως ο αριθμός των μονάδων αυξάνεται αντί να μειώνεται η θεωρητική απόσταση μεταξύ των clusters όταν έχεις 32 είναι τόσο τεράστιο που ακούγεται εξίσου απίθανο.

 

Καλύτερος επιλαχών αυτή τη στιγμή μοιάζει να είναι η θεωρία των 16 clusters. [16*(4*8)] με άλλα λόγια 16 clusters/"cores" όπου ο καθένας αποτελείται από 4 οχτάδες SPs. Στο GT200 είχαμε 3*8 έναντι 2*8 στο G80 και το 4*8 είναι ένα απόλυτα λογικό σενάριο συνέχειας της ιστορίας. Μεταξύ άλλων και γιατί θα δώσει τουλάχιστον διπλάσιες επιδόσεις στις entry level λύσεις μιας και θα έχουν πλέον 32SPs έναντι των σημερινών 16.

 

Το καλύτερο νέο που ευτυχώς δεν κατάφεραν ως τώρα να παπαγαλήσουν οι διάφοροι παπαγάλοι ("πολύυυυυυυυυ μικρό μεγάαααααααααααλη διάρκεια") είναι ότι η κατανάλωση ενέργειας θα είναι μέχρι και 15% χαμηλότερη μιας σημερινής GTX285 (load). Aπόλυτα αναμενόμενο IMHLO με τις αλλαγές που υποτίθεται ότι έκαναν όπου λογικά το κάθε cluster θα χρονίζεται με διαφορετικούς χρονισμούς ανάλογα με τον φόρτο. Αν ισχύει και το power gating για idle θα έχει επίσης πολύ χαμηλή κατανάλωση ενέργειας σε αδράνεια.

 

Μιας και οι περισσότεροι game developers κατ' επανάληψη τόνισαν ότι οι σημερινές κάρτες υστερούν σοβαρά στον τομέα rasterizing δεν θα μου έκανε ιδιαίτερη εντύπωση αν δούμε μια καλή αύξηση στον παραλληλισμό όσων αφορά rasterizing/tri-setup ή ακόμα και παραπάνω από μία μονάδα γεωμετρίας.

 

Τέλος ο Theo Valich κάτι ψελλίζει για 7x-10x φορές αύξηση όσων αφορά τις επιδόσεις dual precision. Aν αληθεύει όντως το μόνο πιθανό σενάριο είναι να μην υπάρχουν πλέον ανεξάρτητες μονάδες DP αλλά να έρχεται από τα ALUs όπως στις σημερινές Radeon.

 

Καθαρά θεωρητικά μαθηματικά:

 

512 SPs * 3 FLOPs * 1.6GHz = 2.46 TFLOPs

 

2.46 TFLOPs single precision / 4 = 614 GFLOPs double precision

 

GT200 DP performance = 78 GFLOPs

 

614 GFLOPs / 78 GFLOPs = 7.9x

 

***edit: αν και λογικά αμφότερες εταιρίες είναι έτοιμες να στείλουν τους πυρήνες τους για παραγωγή, ο ανασταλτικός παράγοντας είναι τα αρκετά κακά yields μέχρι στιγμής που έχει το 40G@TSMC. Επίσης από ότι καταλαβαίνω αμφότερες εταιρίες θέλουν να χρησιμοποιήσουν GDDR5@1100MHz πρέπει να υπάρχει θέμα διαθεσιμότητας και εκεί. Το πιθανότερο είναι να δούμε τις Χ11 κάρτες κατά το Q4 αυτής της χρονιάς με μικρή χρονική απόσταση η μία από την άλλη. ΄Η ακόμα καλύτερα όχι νωρίτερα από τον Οκτώβριο 2009....

Δημοσ.

Συγνώμη που κάνω κατάχρηση στο θέμα, αλλά μιας και συζητάμε για νέες τεχνολογίες ήθελα να σας ρωτήσω εάν ξέρετε τι τεχνολογίας chip γραφικών έχει η Broadcom (αναφορές εδώ http://www.broadcom.com/products/Consumer-Electronics/High-Definition-Audio-Video-Graphics-System-Processors ), μιας και η Intel έχει δείξει ενδιαφέρον. http://www.fudzilla.com/content/view/13806/1/

Δημοσ.
Συγνώμη που κάνω κατάχρηση στο θέμα, αλλά μιας και συζητάμε για νέες τεχνολογίες ήθελα να σας ρωτήσω εάν ξέρετε τι τεχνολογίας chip γραφικών έχει η Broadcom (αναφορές εδώ http://www.broadcom.com/products/Consumer-Electronics/High-Definition-Audio-Video-Graphics-System-Processors ), μιας και η Intel έχει δείξει ενδιαφέρον. http://www.fudzilla.com/content/view/13806/1/

 

Νέα τεχνολογία οι επεξεργαστές για decoding? Aπλά το Pinetrail θα έχει μάλλον κάτι σε GMA950 της Intel και εφόσον είναι πάντα καλύτερο να έχεις ένα μικρό chip με ελάχιστη κατανάλωση για πράγματα όπως video decoding.

 

Tα σημερινά ΑΤΟΜ Ζ που έχουν το GMA500 (PowerVR SFX535) έχουν και αυτά το PowerVR VXD για τον ίδιο λόγο όπως παραπάνω:

 

http://www.imgtec.com/powervr/powervr-vxd.asp

 

Ολοκληρωμένη GPU έτσι όπως το καταλαβαίνουμε συνήθως δεν είναι το chip της Broadcom.

Δημοσ.

Δεν ξερω αν καταφερει να φτασει 2,16Τflop με μολις 50% μεγαλυτερο πυρηνα και μη συντηρητικούς χρονισμούς, η ati-amd εχει τον τελευταιο λογο.

Untitled998.png

Δημοσ.

Τον Ιούλιο σβήστον από το μυαλό σου για αρχή και κάντο Q4 09' για να είσαι μέσα.

 

Πέραν τούτου τα 900MHz στα 40nm λογικά δεν θα πρέπει να είναι πρόβλημα. Για να έχουν λογική ωστόσο τα 1200SPs & τα 48 TMUs θα πρέπει να μιλάμε για 240 ALUs.

 

RV770 = 800 SPs / 5 (Vec5) = 160 ALUs / 16 (16 SIMD) = 10 clusters

"RV870" = 1200 SPs / 5 (Vec5) = 240 ALUs / 20 (20 SIMD) = 12 clusters

 

12 clusters * 4 TMUs/cluster = 48 TMUs

 

Eπειδή μεταξύ άλλων τα 20 SIMD να έχουν μεγαλύτερες "απαιτήσεις" από τα ROPs να υπάρχουν και 32 συνολικά πλέον.

 

Να θυμάσαι ότι τα ALUs γενικά δεν καταλαμβάνουν μεγάλο χώρο στους σημερινούς πυρήνες. Χοντρικά περίπου είναι στο 1/4 του πυρήνα οπότε όση και να είναι η αύξηση δεν επηρεάζει τόσο το τελικό μέγεθος του πυρήνα όσο σε σύγκριση μονάδες όπως τα TMUs (+20%) & τα ROPs (+100%).

 

Αυτό δεν σημαίνει φυσικά ότι τα παραπάνω είναι ντε και καλά σωστά. Προσωπικά θα περίμενα κάτι στην ίδια κατεύθυνση αλλά με 16 clusters. Aν όντως τα παραπάνω ισχύουν, η απόσταση μεταξύ G300 & RV870 θα είναι μάλλον κατά πολύ μεγαλύτερη από ότι μεταξύ GT200 & RV770. Και ναι αναμενόμενο ήταν γιατί το τελευταίο που γουστάρει η NV είναι να βρίσκεται για μεγάλο χρονικό διάστημα στριμωγμένη στην γωνία.

 

Αν και η ενότητα δεν αφορά ουσιαστικά την Intel τα τελευταία νέα δεν φαίνονται καθόλου καλά για το μελλοντικό εγχείρημα γραφικών τους. Πόσες ψυχές θα είχα αν όντως ήμουν γάτος; Τόσα τα μέχρι σήμερα revisions. Kαι να'ταν το χειρότερο στην κατάσταση που βρίσκεται σήμερα....πόσα είναι τα παλληκάρια από την Λεβαδιά; ....μέχρι τόσες φορές είναι αργότερο στην χειρότερη περίπτωση από την σημερινή γρηγορότερη κάρτα γραφικών.

Δημοσ.

Αν και η ενότητα δεν αφορά ουσιαστικά την Intel τα τελευταία νέα δεν φαίνονται καθόλου καλά για το μελλοντικό εγχείρημα γραφικών τους. Πόσες ψυχές θα είχα αν όντως ήμουν γάτος; Τόσα τα μέχρι σήμερα revisions. Kαι να'ταν το χειρότερο στην κατάσταση που βρίσκεται σήμερα....πόσα είναι τα παλληκάρια από την Λεβαδιά; ....μέχρι τόσες φορές είναι αργότερο στην χειρότερη περίπτωση από την σημερινή γρηγορότερη κάρτα γραφικών.

Αναμενόμενο αυτο, τουλαχιστον για μενα. Επισης νομιζω η R800 θα βγει νωριτερα απο τη GT300 και ειναι και η τελευταια γενiα τιυ R600.

Αρχειοθετημένο

Αυτό το θέμα έχει αρχειοθετηθεί και είναι κλειστό για περαιτέρω απαντήσεις.

  • Δημιουργία νέου...