Προς το περιεχόμενο

Single Core Performance vs IPC (1 core + 1 core SMT/HT vs 1 core) Zen vs Kaby Lake/Coffee Lake


Προτεινόμενες αναρτήσεις

Δημοσ.

Αυτό που ήθελα να δω είναι γιατί βλέπω τόσο καλά αποτελέσματα με τον 1700 και καλα σεταρισμένες μνήμες. Είναι κάτι το οποιο το είχαμε διαβάσει εδώ και αρκετό καιρό από τον Agner Fog: http://www.agner.org/optimize/blog/read.php?i=838

 

This is where simultaneous multithreading comes in. You can run two threads in the same CPU core (this is what Intel calls hyperthreading). Each thread will then get half of the resources. If the CPU core has a higher capacity than a single thread can utilize then it makes sense to run two threads in the same core. The gain in total performance that you get from running two threads per core is much higher in the Ryzen than in Intel processors because of the higher throughput of the AMD core (except for 256-bit vector code).
 
Που σημαίνει πρακτικά ότι ένας Zen πυρήνας έχει πιο υψηλό θεωρητικό throughput από οποιονδήποτε Intel πυρήνα (Skylake/Kaby/Coffee) clock for clock, αλλα αυτό δεν φαίνεται σε single thread benchmarks πουθενά, γιατί? Γιατί αυτό ισχύει μονο όταν συνυπολογίζουμε και το SMT thread (που χωρίζει ένα physical core σε 2 logical cores ή threads). Έκανα ένα test στο Cinebench με 2 threads και affinity με process lasso σε core 0/1 (δηλαδή 1 core και 1 smt thread στο ίδιο core), με αυτό το αποτέλεσμα στα 4.0 GHz:
 
singlecoremly7q.png
 
Δηλαδή όσο περίπου βγάζει ένας 7600k στα 5.2 GHz με single core (χωρίς HT). Οποιος θέλει να τρέξει αυτά τα δυο test με Core 0/1, 2/3, 4/5 κτλ (1 core + HT/SMT) είναι σχετικά απλή υπόθεση, απλά βάζεις affinity 0/1 με το που ξεκινάει το cinebench (αφού βάλεις στα preferences 2 threads).
  • Like 10
  • Απαντ. 125
  • Δημ.
  • Τελ. απάντηση

Συχνή συμμετοχή στο θέμα

Δημοσ.

Σε εμένα ενώ αλλάζω το affinity , μόλις ξεκινήσει το τεστ του cinebench γυρνάει πάλι σε όλα τα cores..Μόνο άμα αρχίζει το benchmark και μετά το αλλάξω το κρατάει. Αλλά έτσι τα πρώτα δευτερόλεπτα είναι με όλα τα cores και επηρρεάζει λογικά έστω και λίγο το σκορ.

Δημοσ.

Σε εμένα ενώ αλλάζω το affinity , μόλις ξεκινήσει το τεστ του cinebench γυρνάει πάλι σε όλα τα cores..Μόνο άμα αρχίζει το benchmark και μετά το αλλάξω το κρατάει. Αλλά έτσι τα πρώτα δευτερόλεπτα είναι με όλα τα cores και επηρρεάζει λογικά έστω και λίγο το σκορ.

 

Αν έχεις ανοιχτό το process lasso στο affinity πριν αρχίσεις το bench και πατήσεις με το που αρχίσει είναι μια χαρά, λίγο timing θέλει :-D

Δημοσ.

Αν ενεργοποιήσουμε σε ένα kabylake πυρήνα και το smt δεν ξαναβγένει μπροστά clock for clock?

Δηλαδή ο+1 από 7700k κι όχι από 7600k.

 

Ή δεν έχω καταλάβει σωστά?

Δημοσ.

Δεν το κατάλαβα το σκεπτικό σου...

 

Δηλαδή έτρεξες σε ένα core ενεργό + HT, δλδ 1+1 και σου έβγαλε 226; Εγώ αν τα έκανα καλά μου έβγαλε 240 χωρις Oc. 

Δημοσ.

Αν ενεργοποιήσουμε σε ένα kabylake πυρήνα και το smt δεν ξαναβγένει μπροστά clock for clock?

Δηλαδή ο+1 από 7700k κι όχι από 7600k.

 

Ή δεν έχω καταλάβει σωστά?

 

Δοκίμασε το, βάλτον στα 4.0 GHz άνοιξε process lasso έχε ανοιχτό το affinity και με το που ξεκινάει(αφού το βάλεις σε 2 threads) βάλε core 0/1, αν το αφήσεις διαλέγει διαφορετικά cores (πχ core 0,2) και βγαίνουν λάθος τα αποτελέσματα. Η λογική είναι ότι τρέχουμε το ένα core στο μέγιστο throughput, 1 core thread + 1 HT/SMT thread (που τρέχει στο ίδιο core).

Δημοσ.

Το Cinebench είναι λίγο μπελαλίδικο για το πετύχεις σωστά αλλα το cpu-z είναι σχετικά εύκολο γιατί δεν αλλάζει το affinity όπως το cb.

Δημοσ.

 

Αυτό που ήθελα να δω είναι γιατί βλέπω τόσο καλά αποτελέσματα με τον 1700 και καλα σεταρισμένες μνήμες. Είναι κάτι το οποιο το είχαμε διαβάσει εδώ και αρκετό καιρό από τον Agner Fog: http://www.agner.org/optimize/blog/read.php?i=838

 

 
Που σημαίνει πρακτικά ότι ένας Zen πυρήνας έχει πιο υψηλό θεωρητικό throughput από οποιονδήποτε Intel πυρήνα (Skylake/Kaby/Coffee) clock for clock, αλλα αυτό δεν φαίνεται σε single thread benchmarks πουθενά, γιατί? Γιατί αυτό ισχύει μονο όταν συνυπολογίζουμε και το SMT thread (που χωρίζει ένα physical core σε 2 logical cores ή threads). Έκανα ένα test στο Cinebench με 2 threads και affinity με process lasso σε core 0/1 (δηλαδή 1 core και 1 smt thread στο ίδιο core), με αυτό το αποτέλεσμα στα 4.0 GHz:
 
 
 
Δηλαδή όσο περίπου βγάζει ένας 7600k στα 5.2 GHz με single core (χωρίς HT). Οποιος θέλει να τρέξει αυτά τα δυο test με Core 0/1, 2/3, 4/5 κτλ (1 core + HT/SMT) είναι σχετικά απλή υπόθεση, απλά βάζεις affinity 0/1 με το που ξεκινάει το cinebench (αφού βάλεις στα preferences 2 threads).

 

 

 

Για αυτό τον λογο δεν παίζει η AMD να βγάλει 6C/6T , 8c/8t RYZEN. Θα καταστρέψει μεγάλο μέρος του chip.

 

Και τα R3 4/4 που έβγαλε, πολύ της είναι ....

  • Like 1
Δημοσ.

Αυτα τα score που δινεις Spartan117 ειναι πανω απο 6700Κ στα 4,0ghz με 1 core + ΗΤ = 2 threads.

Εμεινα μαλακας τωρα με τον Ryzen....

  • Like 1
Δημοσ.

Εγώ είμουνα νυσταγμένος χθες, δεν το πέτυχα να δουλέψει το lasso.

Spartan αν θες το κάνεις λιανά (για ηλίθιους) πως γίνεται μπας και το πετύχω?

 

sidenote, θυμάμαι κάπου να διαβάζω ότι το gain του ht μειώνεται όσο αυξάνεται η συχνότητα.

  • Like 2
Δημοσ.

Εγώ είμουνα νυσταγμένος χθες, δεν το πέτυχα να δουλέψει το lasso.

Spartan αν θες το κάνεις λιανά (για ηλίθιους) πως γίνεται μπας και το πετύχω?

 

sidenote, θυμάμαι κάπου να διαβάζω ότι το gain του ht μειώνεται όσο αυξάνεται η συχνότητα.

 

Κατεβάζεις process lasso, το ανοίγεις, ανοίγεις το cinebench, ανοίγεις το affinity για το cinebench, διαλέγεις ένα core και ένα ht (στο ίδιο core, πχ 2/3, 4/5) το βάζεις σε 2 threads preference, πατάς run και πατάς ok στο affinity κατευθείαν:

 

1wnx8a.png

 

Και τσεκάρεις στο task manager αν όντως τρέχει σε αυτά που το έβαλες με το affinity.

  • Like 1

Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε

Πρέπει να είστε μέλος για να αφήσετε σχόλιο

Δημιουργία λογαριασμού

Εγγραφείτε με νέο λογαριασμό στην κοινότητα μας. Είναι πανεύκολο!

Δημιουργία νέου λογαριασμού

Σύνδεση

Έχετε ήδη λογαριασμό; Συνδεθείτε εδώ.

Συνδεθείτε τώρα
  • Δημιουργία νέου...