Προς το περιεχόμενο

NVIDIA Pascal, GP100


Ailuros

Προτεινόμενες αναρτήσεις

Γι' αυτό υπάρχουν τα settings στα παιχνίδια, επειδή ακριβώς δεν μπορούν όλοι να αγοράσουν high-end κάρτες. Το θέμα είναι όμως το Low με το Ultra να είναι η μέρα με τη νύχτα και όχι όπως τώρα που οι διαφορές είναι μικρές.

  • Like 3
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

  • Απαντ. 7,8k
  • Δημ.
  • Τελ. απάντηση

Συχνή συμμετοχή στο θέμα

Witcher 3, witcher 3 και Witcher 3 και λίγο GTA V. :P

 

Μιλάμε για έναν τίτλο που δεν έχει interactive shadows μέσα στο Novigrad το βράδυ, έτσι; Ένα virtual world που το φεγγάρι κάνει σκιές και οι πυρσοί όχι, έτσι;  :P

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

aOUaS88

 

στο συγκεκριμένο youtube η απάτη είναι η χαμηλή RAM όπου δένει τα πόδια και στα 2 συστήματα

αν δέσεις τα πόδια στον καρλ λιουις και σε έναν αγυμναστο χοντρό 150 κιλά και τους βάλεις να τρέξουν μην νομίζεις ότι ο καρλ λιουις θα καταφέρει καμια σοβαρή διαφορά.

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Αν και ξεκινησε απο το maxwell, επειδή ισχύει και για το pascal το βάζω εδώ.

 

Nvidia gpus implement tile based rasterization for greater efficiency

 

link1 link2

 

Τωρα αν επαιξε τόσο μεγάλο ρόλο στο perf/watt στο maxwell σε σχέση με kepler αλλα και γενικα σε σχεση με την amd ας βοηθήσει ο ailuros.

 

Πάντως 2 χρονια που βγήκαν οι maxwell καρτες, η amd δεν το ειδε ώστε να το εφαρμοσει και αυτή στα polaris κλπ, αφου τα οφελη του ειναι ξεκάθαρα?

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Αν και ξεκινησε απο το maxwell, επειδή ισχύει και για το pascal το βάζω εδώ.

 

Nvidia gpus implement tile based rasterization for greater efficiency

 

link1 link2

 

Τωρα αν επαιξε τόσο μεγάλο ρόλο στο perf/watt στο maxwell σε σχέση με kepler αλλα και γενικα σε σχεση με την amd ας βοηθήσει ο ailuros.

 

Πάντως 2 χρονια που βγήκαν οι maxwell καρτες, η amd δεν το ειδε ώστε να το εφαρμοσει και αυτή στα polaris κλπ, αφου τα οφελη του ειναι ξεκάθαρα?

 

Tίποτα που δεν το λέγαμε εδώ και αρκετό καιρό και μάλιστα όταν το ανέφερα πρώτη φορά σε άλλο forum με βγάλανε και τρελό. ΄Οχι δεν έπαιξε ΤΟΣΟ μεγάλο ρόλο όσο θα φανταζόταν κανείς αλλά βοήθησε και αυτό μεταξύ άλλων.

 

Για όσους δεν το ξέρουν εδώ και δεκαετίες πιστεύω στην εναλλακτική μέθοδο της PowerVR η οποία φυσικά έχει τόσο προτερήματα όσο και μειονεκτήματα. Η NV το μόνο που έκανε είναι να εφαρμόσει ένα κομμάτι από αυτό που κάνουν συνήθως oι tilers χωρίς να πειραχτούν τα παραδοσιακά προτερήματα της αρχιτεκτονικής τους, αλλά αυτό το κάνουν όλοι οι IHV όποια μέθοδο και να χρησιμοποιούν.

 

Αυτό για το οποίο κομμάτι του NV engineering θα έπρεπε στην κυριολεξία να ντρέπεται είναι το πρώιμα μηνύματα όταν ξεκίνησαν με τα Tegra ότι "tiling stinks" και μάλιστα ενορχηστρωμένο από πάλαι ποτέ engineers της πρώην Gigapixel οι οποίοι να είχαν πρήξει στα φούμαρα στα τέλη της δεκαετίας του 90' χωρίς να κυκλοφορήσουν ποτέ τίποτα σε hw. Λογικό βέβαια να το περάσουν τελικά από την πίσω πόρτα.

 

https://forum.beyond3d.com/threads/tile-based-rasterization-in-nvidia-gpus.58296/#post-1934105

 

 

 

I would assume that the tile size matches the ROP cache size. However Nvidia hardware doesn't have dedicated ROP caches, so I'd assume that the tile buffer resizes on L2 cache (where they usually keep the ROP outputs). Did you pixel count the tile sizes? My guess would be something between [32x32, 128x128] as that's close to the footprint of traditional ROP caches.

 

Some years ago I did ROP cache experiments with AMD GCN (7970) in order to optimize particle rendering. GCN has dedicated ROP caches (16 KB color, 4 KB depth). In my experiment I split the rendering to 64x64 tiles (= 16 KB). This resulted in huge memory bandwidth savings (and over 100% performance increase), especially when the overdraw was large (lots of full screen alpha blended particles close to the camera). You can certainly get big bandwidth advantages also on AMD hardware, as long as you sort your workload (by screen locality) before submitting it.

 

It's hard to draw 100% accurate conclusions from the results. This doesn't yet prove whether Nvidia is just buffering some work + reordering on fly to reach better ROP cache hit ratio, or whether they actually do hidden surface removal as well (saving pixel shader invocations in addition to bandwidth). This particular test shader doesn't allow the GPU to perform any hidden surface removal, since it increases an atomic counter (it has a side effect).

 

To test HSR, you'd have to enable z-buffering (or stencil) and use [earlydepthstencil] tag in the pixel shader. This tag allows the GPU to skip shading the pixel even when it has side effects (DX documentation is incorrect about this). Submit triangles in back-to-front order to ensure that early depth doesn't cull anything with immediate mode rendering. I would be interested to see whether this results in zero overdraw on Maxwell/Kepler (in this simple test with some overlapping triangles and also with higher triangle counts).

 

It would also be interesting to know how many (vertex output) attributes fit to the buffer.

 

The new (Nvidia and Oculus) multiview VR extensions would definitely benefit from separating SV_Position part of the vertex shader to its own shader. This would also greatly benefit tiled rendering (do tile binning first, execute attribute shader later). I wouldn't be surprised if Nvidia did already something like this in Maxwell or Pascal, as both GPUs introduced lots of new multiview VR extensions.

 

I just wish Nvidia would be as open as AMD regarding to their GPU architecture

 

Και η απάντησή σου για την AMD.

  • Like 2
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Χαχα ο DK να κάνει το πείραμα κ φέρνει πειστίρια ακουγεται καπως περίεργο :D

 

το tiling βολεύει και περιπτώσεις συνεργασίας ασυμετρων gpu αν και δεν έχουμε τη χαρα να δουμε κατι αντίστοιχο απο nV ως τώρα

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Χαχα ο DK να κάνει το πείραμα κ φέρνει πειστίρια ακουγεται καπως περίεργο :D

 

το tiling βολεύει και περιπτώσεις συνεργασίας ασυμετρων gpu αν και δεν έχουμε τη χαρα να δουμε κατι αντίστοιχο απο nV ως τώρα

 

Mπορώ να σου πω ότι η πράσινη κρατάει μόνο ένα μικρό ποσοστό πολυγώνων on chip όπου και όταν αυτό βολεύει. Oι tilers γενικά έχουν ένα θέμα με μεγάλες ποσότητες γεωμετρίας όπου στην πλειοψηφία των περιπτώσεων καταναλώνουν αρκετό χρόνο στο να περνάνε από ακατάσχετο buffering τα εκάστοτε δεδομένα γεωμετρίας, απλά επειδή στην πλειοψηφία τους η ίδια γεωμετρία πρέπει να επεξεργαστεί πολλαπλές φορές. Εδώ η Imagination έχει αρκετές ευρεσιτεχνίες για δεκαετίες τώρα και είναι και ο μοναδικός πραγματικός deferred renderer (χωρίς να σημαίνει ότι δεν υπάρχουν και εδώ μειονεκτήματα), αλλά κατά βάση η γεωμετρία επεξεργάζεται μόνο μια φορά και αυτό γιατί κάνουν tiling σε raster επίπεδο και όχι bounding box tiling που κάνουν όλοι οι άλλοι.

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Η imagination έχει πατέντες μεν, άλλα από όσο φαίνεται η nv κάνει και κόλπα στο driver που ούτε η imagination δεν έχει φανταστεί.

Δε φαίνεται να ανέτρεψαν τα πάντα, και πιθανά η προεργασία (ειδικά) για τα πολύγωνα που δε φαίνονται να γίνεται νωρίς με κλασικό τρόπο και να μοιράζονται κεντρικά σε μικρότερα buffers/cache

Κάπου εδώ πρέπει να κυκλοφορεί και ο timur21 που ήταν οπαδός των Kyro :B

Γενικά πάσο, σίγουρα θα υπάρχουν corner cases που θα επιφέρουν καθυστερήσεις. Εάν ο ανταγωνισμός βρει αυτά τα corner cases και τα χρησιμοποιήσει σε ευλογημένα παιχνίδια του… θα φανεί στο αποτέλεσμα

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Η imagination έχει πατέντες μεν, άλλα από όσο φαίνεται η nv κάνει και κόλπα στο driver που ούτε η imagination δεν έχει φανταστεί.

Δε φαίνεται να ανέτρεψαν τα πάντα, και πιθανά η προεργασία (ειδικά) για τα πολύγωνα που δε φαίνονται να γίνεται νωρίς με κλασικό τρόπο και να μοιράζονται κεντρικά σε μικρότερα buffers/cache

Κάπου εδώ πρέπει να κυκλοφορεί και ο timur21 που ήταν οπαδός των Kyro :B

Γενικά πάσο, σίγουρα θα υπάρχουν corner cases που θα επιφέρουν καθυστερήσεις. Εάν ο ανταγωνισμός βρει αυτά τα corner cases και τα χρησιμοποιήσει σε ευλογημένα παιχνίδια του… θα φανεί στο αποτέλεσμα

 

https://translate.googleusercontent.com/translate_c?depth=1&hl=en&ie=UTF8&prev=_t&rurl=translate.google.gr&sl=fr&tl=en&u=http://www.hardware.fr/news/14729/tile-rendering-maxwell-pascal.html&usg=ALkJrhhi__Zu_L3wNBeTEwmxpbNfGaprrA

 

Mην πάμε πολύ off topic αλλά να θυμάσαι ότι οποιοδήποτε HSR σε hardware είναι "low level". Aν η μηχανή του παιχνιδιού δεν έχει καλό data rejection/portals ή οτιδήποτε σχετικό δεν μπορεί να σου κάνει το καλύτερο hw τίποτα. Πες ότι είσαι σε διάδρομο με σκέτους τοίχους. Αν δεν έχει μπλοκαριστεί από την μηχανή του παιχνιδιού το περιεχόμενο πίσω από τους τοίχους οποιαδήποτε μονάδα γραφικών θα κάτσει να επεξεργαστεί δεδομένα ενός ολόκληρου κάστρου και ας είναι δεδομένα που δεν είναι ορατά στον παίχτη και θα' πρεπε να απορριφθούν σαν overdraw πολύ νωρίς στο ξεκίνημα της επεξεργασίας.

 

Επίσης αξίζει να διαβάσεις τα σχόλια του Andrew Lauritzen (Intel graphics engineer) εδώ: https://forum.beyond3d.com/threads/tile-based-rasterization-in-nvidia-gpus.58296/#post-1934164

 

Τώρα για τις ευρεσιτεχνίες γενικά: η πράσινη ούτε κάνει κάτι παράνομο ούτε εναντιώνεται σε οποιαδήποτε ευρεσιτεχνία. Αν διαβάσεις τα σχόλια στο B3D forum τόσο του sebbi όσο και το Andrew δεν είναι δύσκολο να καταλάβει κανείς ότι πρόκειται για πρακτικές/βελτιστοποιήσεις που λίγο πολύ τις εφαρμόζουν όλοι, ο καθένας ανάλογα με την εκάστοτε αρχιτεκτονική.

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε

Πρέπει να είστε μέλος για να αφήσετε σχόλιο

Δημιουργία λογαριασμού

Εγγραφείτε με νέο λογαριασμό στην κοινότητα μας. Είναι πανεύκολο!

Δημιουργία νέου λογαριασμού

Σύνδεση

Έχετε ήδη λογαριασμό; Συνδεθείτε εδώ.

Συνδεθείτε τώρα
  • Δημιουργία νέου...