AMD Navi benchmarks 5500/5600/5700(XT)

Luciddream · 14 Ιουνίου 2020

Φτιάχνω αυτό το τοπικ μόνο για benchmarks των Navi καρτών, για να μην υπάρχει spam στα άλλα τοπικ.

Ξεκινάω με ένα για Linux - Hashcat 6.0.0.RC1 και 20.20 drivers. Οποιοδήποτε request για δοκιμές ευπρόσδεκτο.

Spoiler

luciddream@home ~/b/hashcat-6.0.0> ./hashcat.bin -b
hashcat (v6.0.0) starting in benchmark mode...

Benchmarking uses hand-optimized kernel code by default.
You can use it in your cracking session by setting the -O option.
Note: Using optimized kernel code limits the maximum supported password length.
To disable the optimized kernel code in benchmark mode, use the -w option.

OpenCL API (OpenCL 2.1 AMD-APP (3110.6)) - Platform #1 [Advanced Micro Devices, Inc.]
=====================================================================================
* Device #1: gfx1010, 8064/8176 MB (6732 MB allocatable), 20MCU

Benchmark relevant options:
===========================
* --optimized-kernel-enable

Hashmode: 0 - MD5

Speed.#1.........: 25505.7 MH/s (52.25ms) @ Accel:1024 Loops:1024 Thr:64 Vec:1

Hashmode: 100 - SHA1

Speed.#1.........: 10098.8 MH/s (66.06ms) @ Accel:512 Loops:1024 Thr:64 Vec:1

Hashmode: 1400 - SHA2-256

Speed.#1.........: 4214.1 MH/s (79.18ms) @ Accel:512 Loops:512 Thr:64 Vec:1

Hashmode: 1700 - SHA2-512

Speed.#1.........: 1220.1 MH/s (68.25ms) @ Accel:512 Loops:128 Thr:64 Vec:1

Hashmode: 22000 - WPA-PBKDF2-PMKID+EAPOL (Iterations: 4095)

Speed.#1.........:   517.4 kH/s (78.67ms) @ Accel:256 Loops:512 Thr:64 Vec:1

Hashmode: 1000 - NTLM

Speed.#1.........: 41274.5 MH/s (32.17ms) @ Accel:1024 Loops:1024 Thr:64 Vec:1

Hashmode: 3000 - LM

Speed.#1.........: 25069.4 MH/s (53.07ms) @ Accel:1024 Loops:1024 Thr:64 Vec:1

Hashmode: 5500 - NetNTLMv1 / NetNTLMv1+ESS

Speed.#1.........: 27618.0 MH/s (48.22ms) @ Accel:1024 Loops:1024 Thr:64 Vec:1

Hashmode: 5600 - NetNTLMv2

Speed.#1.........: 1526.4 MH/s (54.63ms) @ Accel:64 Loops:1024 Thr:64 Vec:1

Hashmode: 1500 - descrypt, DES (Unix), Traditional DES

Speed.#1.........:   916.5 MH/s (91.00ms) @ Accel:64 Loops:1024 Thr:64 Vec:1

Hashmode: 500 - md5crypt, MD5 (Unix), Cisco-IOS $1$ (MD5) (Iterations: 1000)

Speed.#1.........: 10368.8 kH/s (60.95ms) @ Accel:1024 Loops:500 Thr:64 Vec:1

Hashmode: 3200 - bcrypt $2*$, Blowfish (Unix) (Iterations: 32)

Speed.#1.........:    24280 H/s (51.28ms) @ Accel:32 Loops:4 Thr:16 Vec:1

Hashmode: 1800 - sha512crypt $6$, SHA512 (Unix) (Iterations: 5000)

Speed.#1.........:   190.7 kH/s (84.95ms) @ Accel:128 Loops:512 Thr:64 Vec:1

Hashmode: 7500 - Kerberos 5, etype 23, AS-REQ Pre-Auth

Speed.#1.........:   385.8 MH/s (54.02ms) @ Accel:256 Loops:64 Thr:64 Vec:1

Hashmode: 13100 - Kerberos 5, etype 23, TGS-REP

Speed.#1.........:   376.0 MH/s (55.30ms) @ Accel:256 Loops:64 Thr:64 Vec:1

Hashmode: 15300 - DPAPI masterkey file v1 (Iterations: 23999)

Speed.#1.........:    88161 H/s (78.57ms) @ Accel:256 Loops:512 Thr:64 Vec:1

Hashmode: 15900 - DPAPI masterkey file v2 (Iterations: 12899)

Speed.#1.........:    41654 H/s (77.52ms) @ Accel:256 Loops:128 Thr:64 Vec:1

Hashmode: 7100 - macOS v10.8+ (PBKDF2-SHA512) (Iterations: 1023)

Speed.#1.........:   521.1 kH/s (68.71ms) @ Accel:256 Loops:127 Thr:64 Vec:1

Hashmode: 11600 - 7-Zip (Iterations: 16384)

Speed.#1.........:   525.0 kH/s (74.25ms) @ Accel:128 Loops:4096 Thr:64 Vec:1

Hashmode: 12500 - RAR3-hp (Iterations: 262144)

Speed.#1.........:    49043 H/s (51.95ms) @ Accel:32 Loops:16384 Thr:64 Vec:1

Hashmode: 13000 - RAR5 (Iterations: 32799)

Speed.#1.........:    53727 H/s (94.81ms) @ Accel:512 Loops:256 Thr:64 Vec:1

Hashmode: 6211 - TrueCrypt RIPEMD160 + XTS 512 bit (Iterations: 1999)

Speed.#1.........:   321.7 kH/s (62.79ms) @ Accel:128 Loops:256 Thr:64 Vec:1

Hashmode: 13400 - KeePass 1 (AES/Twofish) and KeePass 2 (AES) (Iterations: 24569)

Speed.#1.........:    43121 H/s (316.14ms) @ Accel:512 Loops:512 Thr:64 Vec:1

Hashmode: 6800 - LastPass + LastPass sniffed (Iterations: 499)

Speed.#1.........: 3368.2 kH/s (62.23ms) @ Accel:512 Loops:249 Thr:64 Vec:1

Hashmode: 11300 - Bitcoin/Litecoin wallet.dat (Iterations: 200459)

Speed.#1.........:     5614 H/s (74.24ms) @ Accel:128 Loops:512 Thr:64 Vec:1

Started: Sun Jun 14 06:47:01 2020
Stopped: Sun Jun 14 06:52:10 2020

Και ένα Blender benchmark 2.83 με bmw scene (1min 27sec)

Spoiler

Επεξ/σία 14 Ιουνίου 2020 από Luciddream

Luciddream · 14 Ιουνίου 2020

Superposition Benchmark - Linux

Spoiler

LIGHT1NG · 15 Ιουνίου 2020

@Luciddream καλό είναι να γράφουμε και υλοποίηση όμως.

Luciddream · 15 Ιουνίου 2020

1 hour ago, LIGHT1NG said:

@Luciddream καλό είναι να γράφουμε και υλοποίηση όμως.

Εννοείς Sapphire Nitro+ ? Γενικά δεν έγραψα κάτι παραπάνω γιατί τα έχω όλα Auto προς το παρόν, no overclock. Αλλά μπορώ να το γράφω αν βοηθάει. Βέβαια είναι και συνδιασμός motherboard / cpu / ram κτλπ.

Πάμε και ένα SisoftSandra OpenCL module. Sapphire 5700XT Nitro+ (stock) - 2700x CPU (stock), RAM @ 3466

Spoiler

SiSoftware Sandra

Benchmark Results
Aggregate Shader Performance : 2GPix/s
Half-Float Shaders Native : 2.12GPix/s
Single-Float Shaders Native : 16.1MPix/s
Double-Float Shaders Native : 1GPix/s
Quad-Float Shaders Native : 39.23MPix/s
Interface : OpenCL
Results Interpretation : Higher Scores mean Better Performance.
Decimal Numeral System (base 10) : 1Gpix(/s) = 1000MPix(/s), 1Mpix(/s) = 1000kPix(/s), 1kPix(/s) = 1000 pixel(/s), etc.

Performance per Thread
Aggregate Shader Performance : 158.59MPix/s
Half-Float Shaders Native : 482.5MPix/s
Single-Float Shaders Native : 322.52MPix/s
Double-Float Shaders Native : 25.63MPix/s
Quad-Float Shaders Native : 980kPix/s
No. Threads : 40
Results Interpretation : Higher Scores mean Better Performance.
Decimal Numeral System (base 10) : 1Gpix(/s) = 1000MPix(/s), 1Mpix(/s) = 1000kPix(/s), 1kPix(/s) = 1000 pixel(/s), etc.

Performance vs. Speed
Aggregate Shader Performance : 3330.04kPix/s/MHz
Half-Float Shaders Native : 10131.26kPix/s/MHz
Single-Float Shaders Native : 6772.18kPix/s/MHz
Double-Float Shaders Native : 538.21kPix/s/MHz
Quad-Float Shaders Native : 20.60kPix/s/MHz
Results Interpretation : Higher Scores mean Better Performance.

Benchmark Status
Result ID : AMD Radeon RX 5700 XT (2560SP 40C 1.9GHz, 8GB 256-bit) (OpenCL)
BIOS : 017.001.000.049
Computer : ASUS ROG CROSSHAIR VI HERO (WI-FI AC)
Platform Compliance : x64
No. Threads : 1
System Timer : 10MHz

Half-Float FP16
Rendered Image Size : 43520x24480
Threads per Work-group : 16x16

Single-Float FP32
Rendered Image Size : 38400x21600
Threads per Work-group : 16x16

Double-Float FP64
Rendered Image Size : 16640x9360
Threads per Work-group : 16x16

Quad-Float FP128
Rendered Image Size : 5120x2880
Threads per Work-group : 16x16

Graphics Processor
Model : AMD Radeon RX 5700 XT
Interface Version : 2.0.10.10
Driver Version : 3075.12
Video BIOS : 017.001.000.049
Shader Speed : 1.9GHz
Peak Processing Performance (PPP) : 4.88TFLOPS
Adjusted Peak Performance (APP) : 4.39WT
Total Memory : 8GB

Η 2070 Super με το ζόρι φτάνει τα 5000 περίπου στο processing αν και σε κάποια τα πάει καλύτερα.

Επεξ/σία 15 Ιουνίου 2020 από Luciddream

niko13 · 20 Ιουνίου 2020

Στις 14/6/2020 στις 10:50 ΜΜ, Luciddream είπε

Superposition Benchmark - Linux

Απόκρυψη περιεχομένων

Τρελε μου 5000 στο superposition εννοουσες? 2070 super εδω 😁... Asus strix

Επεξ/σία 20 Ιουνίου 2020 από niko13

Luciddream · 20 Ιουνίου 2020

36 minutes ago, niko13 said:

Τρελε μου 5000 στο superposition εννοουσες? 2070 super εδω 😁... Asus strix

Hello, όχι για το SisoftSandra OpenCL Processing λέω... αν έχεις όρεξη τρέξε ένα να δούμε πως τα πάει γιατί στο site μπορεί να έχει αρκετά false results. Αν και είναι λίγο off topic αλλά εμένα δεν με πειράζει αρκεί να μην το παρακάνουμε 😛

Το κατεβάζεις απο εδώ: https://www.guru3d.com/files-details/sandra-sisoft-download.html

Και μετά Benchmarks -> GPUGPU Processing - Προσοχή ΜΗΝ πατήσεις το Overall GPGPU γιατί θα τα τρέξει όλα και κάνει πολή ώρα. Εγώ τα είχα τρέξει όλα αλλά δεν μου κράτησε τα σκορ και τώρα δεν το ξανατρέχω χωρις λόγο.

Επεξ/σία 20 Ιουνίου 2020 από Luciddream

niko13 · 20 Ιουνίου 2020

3 ώρες πριν, Luciddream είπε

Hello, όχι για το SisoftSandra OpenCL Processing λέω... αν έχεις όρεξη τρέξε ένα να δούμε πως τα πάει γιατί στο site μπορεί να έχει αρκετά false results. Αν και είναι λίγο off topic αλλά εμένα δεν με πειράζει αρκεί να μην το παρακάνουμε 😛

Το κατεβάζεις απο εδώ: https://www.guru3d.com/files-details/sandra-sisoft-download.html

Και μετά Benchmarks -> GPUGPU Processing - Προσοχή ΜΗΝ πατήσεις το Overall GPGPU γιατί θα τα τρέξει όλα και κάνει πολή ώρα. Εγώ τα είχα τρέξει όλα αλλά δεν μου κράτησε τα σκορ και τώρα δεν το ξανατρέχω χωρις λόγο.

αδερφε μου χιλια συγνωμη οτι να ναι καταλαβα,καλα να παθω που διαβαζω post με το ενα ματι ανοικτο..ενοχος για thread polution..το ετρεξα το bench αλλα δεν καταφερα με τιποτα να βγαλω τα results με μορφη text οπως εσυ ..αν θες τιποτα πιο λεπτομερη ενημερωσε,εβγαλα ενα screen.απο 5800-6200 αναλογα το σκαλισμα της καρτας σε 12-13 run..

Επεξ/σία 20 Ιουνίου 2020 από niko13

Luciddream · 20 Ιουνίου 2020

7 hours ago, niko13 said:

αδερφε μου χιλια συγνωμη οτι να ναι καταλαβα,καλα να παθω που διαβαζω post με το ενα ματι ανοικτο..ενοχος για thread polution..το ετρεξα το bench αλλα δεν καταφερα με τιποτα να βγαλω τα results με μορφη text οπως εσυ ..αν θες τιποτα πιο λεπτομερη ενημερωσε,εβγαλα ενα screen.απο 5800-6200 αναλογα το σκαλισμα της καρτας σε 12-13 run..

Μια χαρά, thanks! Σιγά δεν υπάρχει θέμα Απλά το Sisoft Sandra μου χει δώσει την εντύπωση ότι βρίσκει όντως τα όρια της κάρτας σε σχέση με άλλα γιαυτό το χρησιμοποιώ. Νομίζω το Text το κάνεις copy με το κουμπάκι που έχει κάτω αριστερά στα results δίπλα απο το γρανάζι, είναι λίγο χάος μέχρι να τα βρεις και εγώ έψαχνα καμια βδομάδα 😛 Πάντως σου δίνει πολύ καλά αποτελέσματα σε σχέση με άλλους, μόνο στα Double-float + Quad-Float το βλέπω κάτω απτην 5700 XT.

Επεξ/σία 20 Ιουνίου 2020 από Luciddream

Luciddream · 20 Ιουνίου 2020

Πείραξα λίγο RAM + CPU σήμερα οπότε έτρεξα άλλο ένα.. μου δίνει λίγο χειρότερα νούμερα βέβαια αλλά βλέπω κάτι είχε πάει στραβά στο προηγούμενο με τα half / single float shaders. Βάζω μόνο τα νούμερα που έχουν νόημα. (Sapphire Nitro+ Auto clocks / +50% Power Limit / PBO Auto / RAM 3200C14)

Benchmark Results
Aggregate Shader Performance : 2GPix/s
Half-Float Shaders Native : 2.07GPix/s
Single-Float Shaders Native : 4.27GPix/s
Double-Float Shaders Native : 1GPix/s
Quad-Float Shaders Native : 38.23MPix/s
Interface : OpenCL
Results Interpretation : Higher Scores mean Better Performance.
Decimal Numeral System (base 10) : 1Gpix(/s) = 1000MPix(/s), 1Mpix(/s) = 1000kPix(/s), 1kPix(/s) = 1000 pixel(/s), etc.

Performance per Thread
Aggregate Shader Performance : 157.55MPix/s
Half-Float Shaders Native : 481.27MPix/s
Single-Float Shaders Native : 321.38MPix/s
Double-Float Shaders Native : 25.29MPix/s
Quad-Float Shaders Native : 955kPix/s
No. Threads : 40
Results Interpretation : Higher Scores mean Better Performance.
Decimal Numeral System (base 10) : 1Gpix(/s) = 1000MPix(/s), 1Mpix(/s) = 1000kPix(/s), 1kPix(/s) = 1000 pixel(/s), etc.

Performance vs. Speed
Aggregate Shader Performance : 3308.20kPix/s/MHz
Half-Float Shaders Native : 10105.33kPix/s/MHz
Single-Float Shaders Native : 6748.22kPix/s/MHz
Double-Float Shaders Native : 530.93kPix/s/MHz
Quad-Float Shaders Native : 20.07kPix/s/MHz
Results Interpretation : Higher Scores mean Better Performance.

Luciddream · 29 Ιουνίου 2020

Ένα τυχαίο FFXV benchmark έτσι για να τεστάρω τους drivers με Hardware Scheduling - δυστυχώς δεν το είχα τρέξει πιο πριν να δω αν έχει διαφορά 😛

(Sapphire Nitro+ Auto clocks / 0% Power Limit / PBO Auto / RAM 3200C14)

Επεξ/σία 29 Ιουνίου 2020 από Luciddream

Luciddream · 29 Ιουνίου 2020

Και ένα GoogleNet ML inference με WinML. Δεν έχω ιδέα από ML οπότε υποθέτω το benchmarking πρέπει να γίνει στο training και όχι στο runtime. Μια παρατήρηση είναι ότι το evaluation της GPU κάνει 12ms ενώ του 2700x κάνει 34ms. Αργεί πολύ βέβαια το session creation.

Spoiler

Created LearningModelDevice with GPU: AMD Radeon RX 5700 XT
Loading model (path = C:\dev-tools\DirectML\googlenet-8.onnx)...
=================================================================
Generating input feature(s) with image: c:\users\luciddream\pictures\llama.jpg
Binding (device = GPU_High_Performance, iteration = 1, inputBinding = CPU, inputDataType = RGB_Image, deviceCreationLocation = WinML)...[SUCCESS]
Evaluating (device = GPU_High_Performance, iteration = 1, inputBinding = CPU, inputDataType = RGB_Image, deviceCreationLocation = WinML)...[SUCCESS]
Outputting top 1 values
Feature Name: prob_1
index: 355, value: 0.99773

Results (device = GPU_High_Performance, numIterations = 1, inputBinding = CPU, inputDataType = RGB_Image, deviceCreationLocation = WinML):

First Iteration Performance (load, bind, session creation, and evaluate):
Load: 26.2767 ms
Bind: 7.2267 ms
Session Creation: 394.05 ms
Evaluate: 12.4505 ms

Working Set Memory usage (evaluate): 1.17188 MB
Working Set Memory usage (load, bind, session creation, and evaluate): 69.6836 MB
Peak Working Set Memory Difference (load, bind, session creation, and evaluate): 112.527 MB

Dedicated Memory usage (evaluate): 16.4531 MB
Dedicated Memory usage (load, bind, session creation, and evaluate): 45.4219 MB

Shared Memory usage (evaluate): 3.125 MB
Shared Memory usage (load, bind, session creation, and evaluate): 6.88672 MB

Επεξ/σία 29 Ιουνίου 2020 από Luciddream

Luciddream · 3 Ιουλίου 2020

Άλλο ένα ML Benchmark - Link

(Sapphire Nitro+ Auto clocks / 50% Power Limit / PBO Auto / RAM 3200C14)

    python tf_cnn_benchmarks.py --num_gpus=1 --batch_size=16 --model=resnet50

    Step    Img/sec total_loss
    1       images/sec: 36.3 +/- 0.0 (jitter = 0.0) 7.993
    10      images/sec: 37.6 +/- 0.4 (jitter = 1.4) 7.854
    20      images/sec: 38.2 +/- 0.3 (jitter = 2.0) 7.726
    30      images/sec: 38.5 +/- 0.2 (jitter = 2.0) 7.360
    40      images/sec: 38.4 +/- 0.2 (jitter = 2.0) 7.526
    50      images/sec: 38.3 +/- 0.2 (jitter = 2.0) 8.171
    60      images/sec: 38.1 +/- 0.2 (jitter = 2.0) 7.999
    70      images/sec: 38.0 +/- 0.2 (jitter = 2.0) 7.978
    80      images/sec: 37.9 +/- 0.1 (jitter = 2.0) 7.884
    90      images/sec: 38.0 +/- 0.1 (jitter = 2.0) 7.924
    100     images/sec: 37.9 +/- 0.1 (jitter = 2.0) 7.848
    ----------------------------------------------------------------
    total images/sec: 37.94
    ----------------------------------------------------------------

Επεξ/σία 3 Ιουλίου 2020 από Luciddream

Luciddream · 6 Ιουλίου 2020

Ένα 3dmark Time Spy. Δεν ξέρω γιατί τα περισσότερα PC βγάζουν τόσο χαμηλό. Ίσως λόγω CPU?

(Sapphire Nitro+ Auto clocks / 50% Power Limit / PBO Auto / RAM 3200C14)

Luciddream · 9 Ιουλίου 2020

100 πόντους πάνω Time Spy με drivers 20.7.1 - Link

(Sapphire Nitro+ Auto clocks / 50% Power Limit / PBO Auto / RAM 3200C14)

Επεξ/σία 9 Ιουλίου 2020 από Luciddream

SabotazNic · 18 Ιουλίου 2020

@Luciddream σε τι αναλυση το τρεχεις? σε 1440π μου βγαζει 9028.

Επισης βγαζει και ερρορ επειδη εχω το tessellation off μεσα στα radeon settings

Σύνδεση

AMD Navi benchmarks 5500/5600/5700(XT)

Προτεινόμενες αναρτήσεις

Luciddream

Συχνή συμμετοχή στο θέμα

Δημοφιλείς Ημέρες

Συχνή συμμετοχή στο θέμα

Δημοφιλείς Ημέρες

Δημοφιλή Μηνύματα

niko13

Luciddream

Luciddream

Δημοσιευμένες Εικόνες

Luciddream

LIGHT1NG

Luciddream

niko13

Luciddream

niko13

Luciddream

Luciddream

Luciddream

Luciddream

Luciddream

Luciddream

Luciddream

SabotazNic

Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε

Δημιουργία λογαριασμού

Σύνδεση

niko13

Luciddream

Luciddream

Σύνδεση