Προς το περιεχόμενο

Nvidia GT300 & ATI RV870


Thresh

Προτεινόμενες αναρτήσεις

Δημοσ.
Εχεις παιξει με 10 fps?....Απλως ρωταω

 

---------- Το μήνυμα προστέθηκε στις 16:15 ----------

 

 

Κατσε ρε συ πηρες φορα ο καθενας οτι θελει παιρνει τι παει να πει πηρε τον 950....

 

υπολογισε ποσα λεφτα,επιδοσεις θα κερδιζε αμα επερνε 920 και μια 5850 ;)

  • Απαντ. 2,9k
  • Δημ.
  • Τελ. απάντηση
Δημοσ.
Χαχαχαχα, μ'αρεσουν τα Slides της NV που παρουσιάζουν τους Nehalem (Core i7/i9 Westmeres) της Intel σαν την μύγα στο σκατό.

Καλά κάνουμε και βρίζουμε τους επεξεργαστές γιατί έχουν μείνει πολύ πίσω σε σχέση με της GPU, έτσι είναι αυτό θα αλλάξει σύντομα με το πάντρεμα CPU-Gpu στο ίδιο τσιπ.

Τα προβλήματα στην σμίκρυνση φάνηκαν και στους ssd με τα 34nm σκάρτες παρτίδες.... τους έφαγε η μαρμάγκα.

Δημοσ.
Καλά κάνουμε και βρίζουμε τους επεξεργαστές γιατί έχουν μείνει πολύ πίσω σε σχέση με της GPU, έτσι είναι αυτό θα αλλάξει σύντομα με το πάντρεμα CPU-Gpu στο ίδιο τσιπ.

Τα προβλήματα στην σμίκρυνση φάνηκαν και στους ssd με τα 34nm σκάρτες παρτίδες.... τους έφαγε η μαρμάγκα.

 

Κατι μου λεει οτι αυτο το παντρεμα δεν θα ειναι και τοσο πετυχημενο στο desktop, αφου τα ιδια και καλυτερα αποτελεσματα μπορουμε να τα παρουμε απο μια ξεχωριστη καρτα.

 

Στα notebook οπου οι απαιτησεις gaming ειναι μικρες και ενα chip all in one μπορει να γλυτωσει χωρο και μπαταρια, θα εχουν επιτυχια.

 

Ασχετο, αλλα μου κανει εντυπωση, που αναφερετε ανεπαρκεια 5850/5870 απο πολλους, αλλα πριν λιγες μερες που ημουν στο πλαισιο καλαμαριας ειδα 5850 απο 3 διαφορετικες εταιριες! Εκτος και αν εβαλαν μονο τα αδεια κουτια οι καφροι, για να ψαρωσουμε.

Δημοσ.
υπολογισε ποσα λεφτα,επιδοσεις θα κερδιζε αμα επερνε 920 και μια 5850 ;)

 

μα δε χρειαζομαι 5850...και τελος με την κριτικη του 950 εγω σε επεξεργαστη ηθελα αυτον ΟΚ?ειχα και τον πηρα...

  • Super Moderators
Δημοσ.

τότε τέλος και εσύ με τα "δεν χρειάζεται κάρτα πάνω από 5770 ή πάνω από 300 euro κτλπ κτλπ"

Δημοσ.
Χαχαχαχα, μ'αρεσουν τα Slides της NV που παρουσιαζουν τους Nehalem (Core i7/i9 Westmeres) της Intel σαν την μύγα στο σκατό.

 

 

Χμμμ δεν νομίζεις ότι είναι μια ενδιαφέρουσα σκοπιά ειδικά αν μιλήσουμε θεωρητικά για GPGPU του μέλλοντος και κάτι σε Llano vs. Sandy Bridge; To GPGPU για τι πράγμα το θέλουμε σε μια GPU; Υπεραπλουστευμένα όταν έχεις πολύ περισσότερα threads ανά clock από ότι μπορεί να σου δώσει μια CPU. Σε αυτή την περίπτωση αν μιλάμε για ένα αρκετά μεγάλο αριθμό threads και βάλουμε και double precision ο επεξεργαστής θα σου βγάλει λευκή σημαία.

 

Βάλε μεταφραστή:

 

http://www.heise.de/newsticker/meldung/SC09-Intel-demonstriert-Larrabee-mit-ueber-1-Teraflops-862305.html

 

Αγνόησε τι λέει για το GF100 γιατί δεν έχει ιδέα ο αρθρογράφος που θα κινηθεί και πρόσεξε τι λέει για τις 58χ0 και θυμίσου τι σου έχω πει για επιδόσεις, κατανάλωση ρεύματος και die area. Mε υπερχρονισμό βγάζει το Teraflop το Laughabee....*yawn* (προσοχή είναι SGEMM benchmark. Βάζω στοίχημα ότι χτυπάει το Teraflop μια 58χ0 και χωρίς υπερχρονισμό).

 

΄Ασχετο teaser:

 

43599219.jpg?AWSAccessKeyId=0ZRYP5X5F6FSMBCCSE82&Expires=1258528460&Signature=TGPCXa%2Bzk7hG7gvVIZLO%2FczEP6Y%3D

 

http://twitpic.com/pyhdf

 

Kleos,

 

Αν και δεν θα'πρεπε να μου πέφτει λόγος σαν απλός χρήστης, αλλά νησάφι πια με το κολλημένο CD. Το καταλάβαμε πια τι θέλεις να πεις μετά από αλλεπάλληλες προσπάθειες, δεν συμφωνούμε και ψιλοαδιαφορούμε κιόλας.

Δημοσ.

Χαχαχαχα, και να σκεφτείς ότι κοντά στα 900 Gigaflops πιάνει μια 4850 του "Χθες"....

 

2.5 Terraflops μια 5870 και 4.6 η Hemlok, έχει αρκετό δρόμο μπροστά της η Intel... Με την Fermi θα μάθουμε λίαν συντόμως από real life computational workloads και όχι τα Slides.

 

Τώρα, όσον αφορά τα Fusion προιοντα, η AMD πιστεύει ότι από το 2011 οι multithreaded εφαρμογές και η τάση προς το parallel computation θα αυξηθεί σημαντικά, 1ος λόγος, το σπρώξιμο από την μεριά της Nvidia (Cuda), η κυκλοφορία της OpenCL και η βασική υποστήριξη DirectCompute από την πλευρά της Microsoft στο DX11.

 

Εξ ου και η φιλοσοφία της AMD, πυρήνες με επίκεντρο το μικρο die size σε σχέση με την Intel (χαμηλό κόστος) και offload τα Floating Point Calculation στα συμπυκνωμένα SIMD units της on die GPU, εδώ πέρα χάνει κάθε ελπίδα η Intel με το IGP που θα ενσωματώσει στον Sandy Bridge παρόλη την υποστήριξη 256bit Vector μέσω του AVX που θα υποστηρίζει. O Bulldozer υποστηρίζει πλήρως το AVX της Intel συν τα extensions SSE5 της AMD και έχει σχεδιαστεί μαζί με την ομάδα ATI για να "ταιριάξει" με την επόμενη αρχιτεκτονική των GPU της.

 

Η φιλοσοφία της Nvidia από την άλλη, είναι να απεμπλακεί από fixed function hardware, πιστεύω πλέον ακράδαντα ότι τόσα χρόνια που μποϊκόταρε το DirectX 10 της Microsoft, ο ουσιαστικός λόγος ήταν αυτός.

Δημοσ.
Χαχαχαχα, και να σκεφτείς ότι κοντά στα 900 Gigaflops πιάνει μια 4850 του "Χθες"....

 

Αμφιβάλλω να βγάζει τόσα σε SGEMM. Πρόσεξε είναι πολύ εξειδικευμένη μέτρηση.

 

2.5 Terraflops μια 5870 και 4.6 η Hemlok, έχει αρκετό δρόμο μπροστά της η Intel... Με την Fermi θα μάθουμε λίαν συντόμως από real life computational workloads και όχι τα Slides.
2.7 για την 5870. Πιστεύω ωστόσο ότι μια 5850 μπορεί να το χτυπήσει το teraflop με SGEMM.

 

Τώρα, όσον αφορά τα Fusion προιοντα, η AMD πιστεύει ότι από το 2011 οι multithreaded εφαρμογές και η τάση προς το parallel computation θα αυξηθεί σημαντικά, 1ος λόγος, το σπρώξιμο από την μεριά της Nvidia (Cuda), η κυκλοφορία της OpenCL και η βασική υποστήριξη DirectCompute από την πλευρά της Microsoft στο DX11.
Για να μην ξαναλέω τα ίδια: http://www.insomnia.gr/forum/showpost.php?p=3013899&postcount=111 δεύτερο κομμάτι του post σε απάντηση του oneofthem. Eίναι σημαντικότερη από πολλές άλλες η τάση στις αγορές embedded form factor όπου θα αργήσει πολύ η NV να εκμεταλλευτεί OpenCL με το Tegra. Mόνο το Tegra3 (έναρξη παραγωγής 2011 και όχι ενσωμάτωση σε συσκευές) θα έχει FP32 ALUs από ότι φαίνεται και με FP24 ALUs (Tegra 1&2) είναι no-no για OpenCL.

 

Εξ ου και η φιλοσοφία της AMD, πυρήνες με επίκεντρο το μικρο die size σε σχέση με την Intel (χαμηλό κόστος) και offload τα Floating Point Calculation στα συμπυκνωμένα SIMD units της on die GPU, εδώ πέρα χάνει κάθε ελπίδα η Intel με το IGP που θα ενσωματώσει στον Sandy Bridge παρόλη την υποστήριξη 256bit Vector μέσω του AVX που θα υποστηρίζει. O Bulldozer υποστηρίζει πλήρως το AVX της Intel συν τα extensions SSE5 της AMD και έχει σχεδιαστεί μαζί με την ομάδα ATI για να "ταιριάξει" με την επόμενη αρχιτεκτονική των GPU της.
Αυτό που θέλω να σου πω είναι όταν αρχίσει να ξεκινάει το τρένο του GPGPU στο μέλλον θα αφορά τις μικρότερες δυνατές συσκευές τσέπης μέχρι τα ατελείωτα server farms. Kαι τότε τέτοιου είδους συγκρίσεις στα σημεία που υπερτερεί μια GPU δεν είναι παράλογες. Αν η Intel έβγαζε ένα γραφικό για τα σημεία που σαφώς υπερτερεί μια CPU οι διαφορές θα ήταν ανάλογες αν κάποιος ήταν τόσο ηλίθιος να τρέξει single ή quad threading κωδικό σε μια GPU. Tα του Καίσαρος Καίσαρη.

 

Η φιλοσοφία της Nvidia από την άλλη, είναι να απεμπλακεί από fixed function hardware, πιστεύω πλέον ακράδαντα ότι τόσα χρόνια που μποϊκόταρε το DirectX 10 της Microsoft, ο ουσιαστικός λόγος ήταν αυτός.
Ποιό fixed function hw ακριβώς εξάλειψε η NV ή σκοπεύει να εξαλήψει; To Larabee έχει μόνο fixed function TMUs, ενώ το GF100 εξακολουθεί να έχει ff hw για TMUs, rasterizing, render back ends και όχι δεν θα σου πω ακόμα τι τρέχει με την μονάδα tesselation. Oι περισσότερες εκτιμήσεις μέχρι τώρα είναι τραγικά λανθασμένες και είναι μεγάλο κεφάλαιο για μια τόσο μικρή και βαρετή μονάδα.

 

Ο πρώτος IHV που έσκουξε να μην μπει programmable tesselation (μιλάμε για εποχές 2000 πλέον...) ήταν η Intel. Eδώ δεν είχαν μονάδες γεωμετρίας για DX9 (για βρες μου που έχει μονάδα vertex shader ή έστω T&L στα DX9 IGP της) και θα πηγαίνανε και για κάτι τόσο πολύπλοκο όσο programmable tesselation;

 

Mε κάθε draft για την δημιουργία του DX10 το tesselation γινόταν όλο και λιγότερο προγραμματιζόμενο μέχρι που κατάντησε fixed function & optional και το αφαιρέσανε στο τέλος εντελώς. Η έκδοση του DX11 programmable tesselation (hull shader->tesselation unit->domain shader) είναι κατά πολύ πιο εξελιγμένη από ότι είχαν αρχικά κατά νου όταν μιλάγανε ακόμα για programmable tesselation για DX10.

 

Οι ψήφοι κατά του τελευταίου στο 10 ήρθαν από Intel, S3, SiS kλπ. και οι μόνες εταιρίες που άφησαν στις αρχιτεκτονικές τους την μονάδα tesselation ήταν η ATI & η PowerVR. Σε σύνολο η ψήφος της NV όπου και να έπεσε δεν θα έκανε την διαφορά γιατί η ψήφος της Microsoft μετράει σαν διπλή.

 

Τώρα όσων αφορά το tesselation οι βασικές του λειτουργίες (όπως και να έχει ενσωματωθεί) είναι οι εξής:

 

- Read the inputs.

- Determine the topology (how many vertices and where they are).

- Collect the vertices into batches.

- Schedule the batches on the clusters.

 

Θα σου πω ότι οι μισές λειτουργίες είναι καλύτερα να τις έχεις σε fixed function hardware και οι υπόλοιπες σε programmable hardware. Πως και που θα το κάνει η κάθε αρχιτεκτονική ενδιαφέρει λιγότερο από την επάρκεια των λειτουργιών αυτών σε πραγματικό χρόνο. Σε καμία περίπτωση όμως το να χρησιμοποιήσεις tesselation εν μέρη ή εξ' ολοκλήρου σε programmable hw δεν σημαίνει ότι είναι software solution. To τι έκαναν ακριβώς δεν είναι ακόμα του παρόντος αλλά όπως σε όλες τις περιπτώσεις hw implementation η εξίσωση έχει ως εξής:

 

It depends on what the area of a fixed-function unit is, times its (expected) utilization, vs the performance (and perhaps complexity) of not using fixed-function.

 

Eδώ μπορείς να έχεις δύο διαφορετικές μονάδες fixed function σε διαφορετικές αρχιτεκτονικές και να έχουν τρομακτικές διαφορές και όχι κάτι τόσο απλό όσο το tesselation.

 

Tώρα αν αναφερόσουν σε κάτι άλλο με το μπαρδόν απλά υπέθεσα ότι εκεί χτύπαγε η καμπάνα.

 

 

---------- Το μήνυμα προστέθηκε στις 11:57 ----------

 

Κάτι της παραπάνω για το SGEMM benchmark:

 

On the SGEMM single precision, dense matrix multiply test, Rattner showed Larrabee running at a peak of 417 gigaflops with half of its 80 cores activated; and with all of the cores turned on, it was able to hit 805 gigaflops. As the keynote was winding down, Rattner told the techies to overclock it, and was able to push a single Larrabee chip up to just over 1 teraflops, which is the design goal for the initial Larrabee co-processors.

 

Here's the next problem. Sparse matrix math is what is commonly needed in simulations involving cloth and water. And on that test, a Larrabee chip that was not overclocked was able to do between 7.9 and 8.1 gigaflops, depending on the test and the size of the matrices.

How many Larrabee chips will we all need to buy to simulate ourselves in virtual worlds? How many will be needed to simulate those virtual worlds? Rattner did not say.

 

:lol:

 

http://www.theregister.co.uk/2009/11/17/sc09_rattner_keynote/page2.html

Δημοσ.

Λοιπον περιμενουμε 5850 καρτες απο 25 του μηνα και μετα αλλα λιγα κομματια. Το μονο που επλιζω ειναι να μην ειναι με αυξημενες τιμες λογο της ζητησης (και φυσικα της εκμεταλευσης των δικων μας καρτελ/ μπακαλικων).

Αρχειοθετημένο

Αυτό το θέμα έχει αρχειοθετηθεί και είναι κλειστό για περαιτέρω απαντήσεις.

  • Δημιουργία νέου...