Nvidia RTX2000/GTX16XX Series (Turing)

pirmen56 · 19 Ιουλίου 2020

26 λεπτά πριν, Aten-Ra είπε

Καλά, όταν θα έχεις την πλειοψηφία των Games σε DirectML , το DLSS θα είναι απλά ένα ακόμα proprietary feature της NVIDIA σαν το Gsync, PhysX κλπ κλπ.

Επίσης, μια χαρά θα τρέχει το DirectML στις κονσόλες, δεν χρειάζεται Brute Force όπως στο DLSS.

https://on-demand.gputechconf.com/siggraph/2018/video/sig1814-2-adrian-tsai-gpu-inferencing-directml-and-directx-12.html

Το 'χαμε ξανασυζητήσει. Το 7.3Χ boost που βλέπεις είναι με tensor cores.

Στις κονσόλες θα έχουν κάποιο image reconstruction της πλάκας(οι κονσολάδες ποτέ δεν νοιάζονταν για IQ) ή κάτι καλoύτσικο αλλά με δυσανάλογα υψηλό κόστος και ίσως με δέσμευση παραδοσιακών shaders. Εκεί που ήταν η nvidia 2 χρόνια τώρα δεν την φτάνουν με την καμία.

Aten-Ra · 19 Ιουλίου 2020

8 ώρες πριν, pirmen56 είπε

Το 'χαμε ξανασυζητήσει. Το 7.3Χ boost που βλέπεις είναι με tensor cores.

Στις κονσόλες θα έχουν κάποιο image reconstruction της πλάκας(οι κονσολάδες ποτέ δεν νοιάζονταν για IQ) ή κάτι καλoύτσικο αλλά με δυσανάλογα υψηλό κόστος και ίσως με δέσμευση παραδοσιακών shaders. Εκεί που ήταν η nvidia 2 χρόνια τώρα δεν την φτάνουν με την καμία.

To 7.3X που βλέπεις είναι η αύξηση που θα πάρεις χρησιμοποιώντας Metacommands μέσα στο DirectML, δεν έχει σχέση με TensorCores η χωρίς TensorCores αφού και στο cuDNN χρησιμοποίει TensorCores.

pirmen56 · 19 Ιουλίου 2020

1 ώρα πριν, Aten-Ra είπε

To 7.3X που βλέπεις είναι η αύξηση που θα πάρεις χρησιμοποιώντας Metacommands μέσα στο DirectML, δεν έχει σχέση με TensorCores η χωρίς TensorCores αφού και στο cuDNN χρησιμοποίει TensorCores.

Πήγαινε στο 24:20 για να ακούσεις για τα tensor cores. Πιο πριν λέει ότι το directML χρησιμοποιεί metacommands "to take advantage of hw specific optimizations". Αυτά είναι η αρχιτεκτονική των tensor cores που λέει παρακάτω. "allowing to use metacommands and take advantage of these tensor cores".

Το cuDNN είναι library για deep learning με αξιοποίηση ΓΕΝΙΚΩΣ των cuda cores. Δηλαδή των πυρήνων μιας GPU. Δεν υπήρχαν tensor cores όταν εμφανίστηκε το cuDNN. Άσχετα αν πρόσφατα αναβαθμίστηκε για να τα αξιοποιεί. Λες η nvidia να περίμενε το directML για να αξιοποιήσει στο έπακρο το δικό της πατενταρισμένο και παγκόσμια πρώτο σε επιδόσεις hw;

https://www.quora.com/What-is-CUDA-and-cuDNN

Aten-Ra · 19 Ιουλίου 2020

1 ώρα πριν, pirmen56 είπε

Πήγαινε στο 24:20 για να ακούσεις για τα tensor cores. Πιο πριν λέει ότι το directML χρησιμοποιεί metacommands "to take advantage of hw specific optimizations". Αυτά είναι η αρχιτεκτονική των tensor cores που λέει παρακάτω. "allowing to use metacommands and take advantage of these tensor cores".

Το cuDNN είναι library για deep learning με αξιοποίηση ΓΕΝΙΚΩΣ των cuda cores. Δηλαδή των πυρήνων μιας GPU. Δεν υπήρχαν tensor cores όταν εμφανίστηκε το cuDNN. Άσχετα αν πρόσφατα αναβαθμίστηκε για να τα αξιοποιεί. Λες η nvidia να περίμενε το directML για να αξιοποιήσει στο έπακρο το δικό της πατενταρισμένο και παγκόσμια πρώτο σε επιδόσεις hw;

https://www.quora.com/What-is-CUDA-and-cuDNN

To cuDNN χρησιμοποίει Tensor Cores από το 2017 σε V100 Volta και μετά στις Turing. Όταν έγινε το video(Siggraph 2018) ήδη το cuDNN χρησιμοποιούσε TensorCores.

https://developer.nvidia.com/blog/programming-tensor-cores-cuda-9/

Programming Tensor Cores in CUDA 9

By Jeremy Appleyard and Scott Yokim | October 17, 2017

Tensor Cores in CUDA Libraries

Two CUDA libraries that use Tensor Cores are cuBLAS and cuDNN. cuBLAS uses Tensor Cores to speed up GEMM computations (GEMM is the BLAS term for a matrix-matrix multiplication); cuDNN uses Tensor Cores to speed up both convolutions and recurrent neural networks (RNNs).

How to Use Tensor Cores in cuBLAS

You can take advantage of Tensor Cores by making a few changes to your existing cuBLAS code. The changes are small changes in your use of the cuBLAS API.

The following sample code applies a few simple rules to indicate to cuBLAS that Tensor Cores should be used; these rules are enumerated explicitly after the code.

How to use Tensor Cores in cuDNN

Using Tensor Cores in cuDNN is also easy, and again involves only slight changes to existing code.

Επεξ/σία 19 Ιουλίου 2020 από Aten-Ra

pirmen56 · 19 Ιουλίου 2020

47 λεπτά πριν, Aten-Ra είπε

To cuDNN χρησιμοποίει Tensor Cores από το 2017 σε V100 Volta και μετά στις Turing. Όταν έγινε το video(Siggraph 2018) ήδη το cuDNN χρησιμοποιούσε TensorCores.

https://developer.nvidia.com/blog/programming-tensor-cores-cuda-9/

Programming Tensor Cores in CUDA 9

By Jeremy Appleyard and Scott Yokim | October 17, 2017

Tensor Cores in CUDA Libraries

Two CUDA libraries that use Tensor Cores are cuBLAS and cuDNN. cuBLAS uses Tensor Cores to speed up GEMM computations (GEMM is the BLAS term for a matrix-matrix multiplication); cuDNN uses Tensor Cores to speed up both convolutions and recurrent neural networks (RNNs).

How to Use Tensor Cores in cuBLAS

You can take advantage of Tensor Cores by making a few changes to your existing cuBLAS code. The changes are small changes in your use of the cuBLAS API.

The following sample code applies a few simple rules to indicate to cuBLAS that Tensor Cores should be used; these rules are enumerated explicitly after the code.

How to use Tensor Cores in cuDNN

Using Tensor Cores in cuDNN is also easy, and again involves only slight changes to existing code.

Η cuDNN library που χρησιμοποιούν δεν πρέπει να αξιοποιεί καθόλου tensor cores. Εξ ου και η τεράστια διαφορά. Το λέει ξεκάθαρα ότι το DirectML επιτρέπει χρήση των tensor cores και γι αυτό βλέπουμε αυτή την αύξηση. Το DirectML είναι της MS. Πιστεύεις ότι η MS ξέρει καλύτερα τα tensor cores από την nvidia;

Σε slides που είχες δείξει ο ίδιος για τις κονσόλες φαινόταν να έχουν περίπου 3 φορές χειρότερες επιδόσεις πινακοπράξεων από μια 2080. Εκτός αν θεωρείς ότι και εν έτει 2020 τα libraries της nvidia για τα tensor cores εξακολουθούν να υπολείπονται του directML(υποθέτωντας ότι ήταν πίσω). DLSS 2.0 επιπέδου image reconstruction δύσκολο να δεις. Παρά μόνο αν βάλουν στόχο τα 30 καρέ π.χ..

nikos5800 · 19 Ιουλίου 2020

2 ώρες πριν, pirmen56 είπε

Η cuDNN library που χρησιμοποιούν δεν πρέπει να αξιοποιεί καθόλου tensor cores. Εξ ου και η τεράστια διαφορά. Το λέει ξεκάθαρα ότι το DirectML επιτρέπει χρήση των tensor cores και γι αυτό βλέπουμε αυτή την αύξηση. Το DirectML είναι της MS. Πιστεύεις ότι η MS ξέρει καλύτερα τα tensor cores από την nvidia;

Σε slides που είχες δείξει ο ίδιος για τις κονσόλες φαινόταν να έχουν περίπου 3 φορές χειρότερες επιδόσεις πινακοπράξεων από μια 2080. Εκτός αν θεωρείς ότι και εν έτει 2020 τα libraries της nvidia για τα tensor cores εξακολουθούν να υπολείπονται του directML(υποθέτωντας ότι ήταν πίσω). DLSS 2.0 επιπέδου image reconstruction δύσκολο να δεις. Παρά μόνο αν βάλουν στόχο τα 30 καρέ π.χ..

Καλά δεν ζητάμε το dlss είναι ανώτερο ,οι κονσόλες θα χρησιμοποιήσουν το rapid packed math aka fp16x2 για το machine learning

Aten-Ra · 19 Ιουλίου 2020

5 ώρες πριν, pirmen56 είπε

Η cuDNN library που χρησιμοποιούν δεν πρέπει να αξιοποιεί καθόλου tensor cores. Εξ ου και η τεράστια διαφορά.

H διαφορά στις επιδόσεις είναι από τα metacommands που αξιοποιούν όλη την αρχιτεκτονική της κάρτας όχι μόνο τα Tensor Cores.

5 ώρες πριν, pirmen56 είπε

Το DirectML είναι της MS. Πιστεύεις ότι η MS ξέρει καλύτερα τα tensor cores από την nvidia;

Τα Tensor Processing Units τα δημιούργησε η Google, όσο τα ξέρει η NVIDIA άλλο τόσο τα ξέρει και η MS και η AMD και άλλοι.

5 ώρες πριν, pirmen56 είπε

Σε slides που είχες δείξει ο ίδιος για τις κονσόλες φαινόταν να έχουν περίπου 3 φορές χειρότερες επιδόσεις πινακοπράξεων από μια 2080. Εκτός αν θεωρείς ότι και εν έτει 2020 τα libraries της nvidia για τα tensor cores εξακολουθούν να υπολείπονται του directML(υποθέτωντας ότι ήταν πίσω). DLSS 2.0 επιπέδου image reconstruction δύσκολο να δεις. Παρά μόνο αν βάλουν στόχο τα 30 καρέ π.χ..

Αυτό που λες είναι μόνο για τα TFlops σε 4bit INT. Επίσης να προσθέσω ότι δεν χρειάζεται εξωφρενικές επιδόσεις από ML για να κάνεις upscale και ML antialising. Δες την RTX2060 που βγάζει 60fps σε 4Κ με το DLSS 2.0 και έχει σχεδόν τα μισά TFlops σε ML από ότι το XΒΟΧ SX.

pirmen56 · 28 Ιουλίου 2020

Spoiler

Επεξ/σία 28 Ιουλίου 2020 από pirmen56

28 Ιουλίου 2020

Αυτό μου έκανε και εμένα εντύπωση. Η απλή 2060 έχει τη διπλή απόδοση σε machine learning από το Series X; Τι φάση; Γενικά το αντίστοιχο DLSS στο XBOX πως θα γίνεται;

pirmen56 · 28 Ιουλίου 2020

Τελικά μάθαμε και γιατί το DLSS 2.0 αφήνει κάποια άσχημα ίχνη και σε ορισμένα μάλιστα αντικείμενα. Δεν υπάρχουν motion vectors για τα πάντα. Ιδανικά χρειάζεται χτίσιμο του game engine γύρω από το DLSS.

20 λεπτά πριν, yiannis1991 είπε

Αυτό μου έκανε και εμένα εντύπωση. Η απλή 2060 έχει τη διπλή απόδοση σε machine learning από το Series X; Τι φάση; Γενικά το αντίστοιχο DLSS στο XBOX πως θα γίνεται;

Θα είναι μια αργή παραλλαγή με στόχο τα 30 έως 60 καρέ στο πιο ιδανικό σενάριο.

28 Ιουλίου 2020

1 ώρα πριν, pirmen56 είπε

Τελικά μάθαμε και γιατί το DLSS 2.0 αφήνει κάποια άσχημα ίχνη και σε ορισμένα μάλιστα αντικείμενα. Δεν υπάρχουν motion vectors για τα πάντα. Ιδανικά χρειάζεται χτίσιμο του game engine γύρω από το DLSS.

Θα είναι μια αργή παραλλαγή με στόχο τα 30 έως 60 καρέ στο πιο ιδανικό σενάριο.

Μόνο; Δηλαδή χωρίς DirectML πόσα θα πιάνει σε 4Κ με gpu σαν την 2080 (super?); Κάτω από 30?

noFEARgr · 28 Ιουλίου 2020

3 λεπτά πριν, yiannis1991 είπε

Μόνο; Δηλαδή χωρίς DirectML πόσα θα πιάνει σε 4Κ με gpu σαν την 2080 (super?); Κάτω από 30?

Υπερβολικος ο pirmen οπως παντα. Τα περισσοτερα games στο xbox Sex θα ειναι 4κ 60, με καποια που πουσαρουν πολυ τα visuals 4k30 και καποια ελαφρια οπως το ori and the will of wisps 120.

Kαποια competitive σαν το cod warzone πιστευω θα εχουν unlocked framerate και θα παιζουν μεταξυ 60-120(?)

LfcYNWA · 28 Ιουλίου 2020

Στις 18/7/2020 στις 3:18 ΜΜ, ilos είπε

Καλά ας κάνει την πλάκα να δώσει ψόφιο rasterization ο πέτσινος και ας έχω όσο performance με DLSS όσο με native στους άλλους και θα δούμε αν αλλάζεις ή όχι.😁

Εγώ προσωπικά δεν πιστεύω ότι η AMD μπορεί να κάνει τέτοιο μεγάλο άλμα μέσα σε μια γενιά και να φτάσει σε επιδόσεις το αντίστοιχο κορυφαίο μοντέλο της Nvidia.

roooster · 29 Ιουλίου 2020

Στις 6/4/2019 στις 4:40 ΜΜ, Psycho_Warhead είπε

Ας γίνει άλλη μια απόπειρα.

22 Απριλίου έρχεται η GTX1650. Μέσα στον μήνα θα κυκλοφήσουν και οι drivers για DXR υποστήριξη σε Pascal και GTX Turing.

Θυμίζει λίγο τον Rudolph, τότε που πήρε το αεροπλάνο μόνος του και πήγε γεμάτος όνειρα υποσχέσεις κι ελπίδες στη Γηραιά Αλβιόνα, ο Alan Turing η μου φαίνεται;

pirmen56 · 29 Ιουλίου 2020

22 ώρες πριν, yiannis1991 είπε

Μόνο; Δηλαδή χωρίς DirectML πόσα θα πιάνει σε 4Κ με gpu σαν την 2080 (super?); Κάτω από 30?

Στις κονσόλες πάντα μαξάρουν την ποιότητα των γραφικών με στόχο ένα ικανοποιητικό IQ και 30 καρέ. Τα 60 καρέ είναι πολυτέλεια. Μόνο για κάτι multiplayer που λέει και ο NoFear.

Κατά φωνή: Possible PlayStation 5 DLSS-Like Image Reconstruction Tech Revealed By New Patent

Σύνδεση

Nvidia RTX2000/GTX16XX Series (Turing)

Προτεινόμενες αναρτήσεις

Συχνή συμμετοχή στο θέμα

Δημοφιλείς Ημέρες

Συχνή συμμετοχή στο θέμα

Δημοφιλείς Ημέρες

Δημοφιλή Μηνύματα

BabisTs

Fulgore

DEADLAZARUS

Δημοσιευμένες Εικόνες

Programming Tensor Cores in CUDA 9

Tensor Cores in CUDA Libraries

How to Use Tensor Cores in cuBLAS

How to use Tensor Cores in cuDNN

Programming Tensor Cores in CUDA 9

Tensor Cores in CUDA Libraries

How to Use Tensor Cores in cuBLAS

How to use Tensor Cores in cuDNN

Επισκέπτης

Επισκέπτης

Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε

Δημιουργία λογαριασμού

Σύνδεση

Σύνδεση