Προς το περιεχόμενο

Single Core Performance vs IPC (1 core + 1 core SMT/HT vs 1 core) Zen vs Kaby Lake/Coffee Lake


Προτεινόμενες αναρτήσεις

Δημοσ.

βοήθα μας λίγο.

 

Το IPC το μετράμε σε σταθερή συχνότητα (πχ 4GHz) με ένα Thread (ένας πυρήνας χωρίς HT/SMT/CMT).

 

Single Thread Performance είναι η επιδόσεις ενός πυρήνα χωρίς HT/SMT/CMT. Εδώ παίζει ρόλο το IPC και η συχνότητα λειτουργιάς του πυρήνα. Όσο ποιο υψηλά και τα δυο τόσο το καλύτερο.

 

Single Core Performance μετράει όλο τον πυρήνα με ενεργοποιημένα τα HT/SMT/CMT . Μπορούμε να το μετρήσουμε σε σταθερή συχνότητα η όχι. Το Single Core Performance μετράει Throughput του πυρήνα.

 

SMT = Simultaneous Multithreading

ΗΤ = Hyper Threading (είναι ονομασία της Intel για το SMT)

CMT = Clustered Multi Threading  (AMD Bulldozer)

 

 

edit: 

Επίσης να τονίσουμε ότι το IPC δεν είναι σταθερό και αλλάζει ανάλογα το πρόγραμμα που τρέχει την κάθε φορά.  Άλλο IPC έχει ο ίδιος επεξεργαστής στο Cinebench και άλλο IPC στο 7zip κλπ κλπ. 

  • Like 3
Δημοσ.

Στην ίδια συχνότητα με παρόμοιες μνήμες έβγαλε λίγο καλύτερο σκορ.

Άρα αν στην ίδια συχνότητα έχει καλύτερο σκορ, τότε έχει περισσότερα instructions στα ίδια clocks.

Άρα καλύτερο ipc. Εσύ μας τα έκανες copy paste εξηγούσες πριν λίγο.

 

Κι έβαλα κι ένα --μάλλον(?)-- just to be safe...

Δημοσ.

Στην ίδια συχνότητα με παρόμοιες μνήμες έβγαλε λίγο καλύτερο σκορ.

Άρα αν στην ίδια συχνότητα έχει καλύτερο σκορ, τότε έχει περισσότερα instructions στα ίδια clocks.

Άρα καλύτερο ipc. Εσύ μας τα έκανες copy paste εξηγούσες πριν λίγο.

 

Κι έβαλα κι ένα --μάλλον(?)-- just to be safe...

 

 

Αν δεν κάνω λάθος στα 4GHz ο 7700Κ βγάζει 174 και ο Ryzen 160, πως έχει καλύτερο IPC ο Ryzen ???  

 

Από τις δικές σας μετρήσεις, 

 

Core i7 7700K @ 4GHz ST score = 174

 

post-262702-0-61239400-1505420475.png

 

Ryzen R7 1700 @ 4GHz ST Score = 160

 

4conz2s.png

 

Απλά να πω πως ο Core i7 3770K στα 4.4GHz μου έβγαλε 160

Δημοσ.

Αν δεν κάνω λάθος στα 4GHz ο 7700Κ βγάζει 174 και ο Ryzen 160, πως έχει καλύτερο IPC ο Ryzen ???  

 

Από τις δικές σας μετρήσεις, 

 

Core i7 7700K @ 4GHz ST score = 174

 

post-262702-0-61239400-1505420475.png

 

Ryzen R7 1700 @ 4GHz ST Score = 160

 

ΜΕ ΤΟ ΕΝΑ CCX ΚΛΕΙΣΤΟ ΠΟΥ ΡΙΧΝΕΙ TO PERFORMANCE

 

4conz2s.png

 

Απλά να πω πως ο Core i7 3770K στα 4.4GHz μου έβγαλε 160

 

Έκανα μια μικρή διόρθωση.

 

Επίσης εγώ σύγκρινα την δική μου τιμή στα 4.0ghz που είναι 226cb με τα 232 cb του spartan

 

το οποιο φυσικα δεν το ειδες, γιατι δεν σε βολευει προσπαθωντας να μας το παιξεις ξερολας

 

post-262702-0-14459000-1505671813_thumb.png

 

Καταλαβες κυριε ξερολα?

 

Συγκρινω το 226 με το 232, φυσικά είναι κοντά,

για αυτό βάζω μάλλον(?) και δεν το παιζω ιστορια

 

 

Πραγματικά συγγνώμη από τους συναναγνώτες για τα κεφαλαία και τα bold,

άλλα ο τύπος είναι ικανός να κάνει και photoshop για να ενισχύσει την παπάτζα του.

 

Έχει τρέξει ο spartan 3 cb, ένα στα 4 με τον chrome ανοιχτό, ένα στα 4 χωρίς τίποτα (ιδανικό)

κι ένα στα 4 με το ένα ccx κλειστό.

 

ΚΑΙ ΨΑΡΕΥΕΙ ΑΥΤΟ ΓΙΑ ΝΑ ΣΤΗΡΙΞΕΙ ΤΗΝ ΠΑΠΑΤΖΑ ΤΟΥ Ο ΑΠΙΘΑΝΟΣ,

ΠΟΥ ΔΕΝ ΣΚΑΕΙ ΓΑΪΔΑΡΟ ΑΠΛΩΣ, ΤΟΝ ΓΑΜΑΕΙ ΚΙΟΛΑΣ.

Δημοσ.

Instructions per clock cycle είναι το IPC και όχι single thread perf. Page 212+ http://www.agner.org/optimize/microarchitecture.pdf

 

The measured throughput is 5 instructions per clock cycle for loops that fit into the µop

cache. Double instructions can still be delivered from the µop cache at this throughput so

that it is possible to execute µops at a throughput of 6 µops per clock, which is the limit of

the µop queue. Double instructions probably use only one entry in the µop cache if the two

µops are similar.

 

...

 

The throughput of each core in the Ryzen is higher than on any previous AMD or Intel x86

processor, except for 256-bit vector instructions. Loops that fit into the µop cache can have

a throughput of five instructions or six µops per clock cycle. Code that does not fit into the

µop cache can have a throughput of four instructions or six µops or approximately 16 bytes

of code per clock cycle, whichever is smaller. The 16 bytes fetch rate is a likely bottleneck

for CPU intensive code with large loops.

Άλλο το IPC και άλλο το single thread performance.

  • Like 2
Δημοσ.

 

 

Συγκρινω το 226 με το 232, φυσικά είναι κοντά,

 

 

Για αυτό είπα να σας μάθω τι είναι το IPC γιατί βλέπω ότι δεν ξέρετε μερικοί εδώ μέσα την διαφορά του IPC με το Core Throughput, αλλά αντί να διαβάσεις τι έγραψα θίχτηκες. Δεν πειράζει,  εγώ φταίω που προσπάθησα να σας εξηγήσω δυο πράγματα, καλή συνέχεια.

Δημοσ.

Φίλε spartan, ο άνθρωπος για να στηρίξει τον ισχυρισμό του διάλεξε το σενάριο

που δεν θα έπρπε καν να μπει σε σύγκριση.

 

Ακόμα και η μέτρηση σου με τον chrome ανοιχτό είναι πιο viable από το ccx κλειστό.

 

Kαι θέλει να μας κάνει και μάθημα.

Δημοσ.

Για αυτό είπα να σας μάθω τι είναι το IPC γιατί βλέπω ότι δεν ξέρετε μερικοί εδώ μέσα την διαφορά του IPC με το Core Throughput, αλλά αντί να διαβάσεις τι έγραψα θίχτηκες. Δεν πειράζει,  εγώ φταίω που προσπάθησα να σας εξηγήσω δυο πράγματα, καλή συνέχεια.

 

Δεν σε είδα να λαμβάνεις υπόψην σου αυτή τη μέτρηση αλλά την άλλη με το ccx κλειστό.

 

Για αυτό κι εγώ έβαλα μάλλον(?) γιατί στην πρώτη μέτρηση δεν μέτρησε με το smt κλειστό ώστε να είμαι σίγουρος, αλλά μπήκα στη διαδιακασία να υποθέσω:

 

ότι με το smt ανοιχτό σκοράρει λίγο παραπάνω άρα μπορεί (για αυτό και το ερωτηματικό)

και με το smt κλειστό να βγάζει λίγο παραπάνω  (δεν το είδα, εύλογη υπόθεση είναι)

 

 

Εσύ που τα ξέρεις αυτά κύριε καθηγητά γιατί μου έβαλες τη μέτρηση με το κλειστό ccx?

  • Like 1
Δημοσ.

Παιδια γενικα ο Aten-Ra ειναι παλιο μελος και θυμαμαι απο παλια που ελεγε οτι το IPC ειναι per clock οχι το per core.
Εχουν ξαναμιλησει διαφοροι γι αυτα.

Το θεμα ειναι υπαρχουν και αλλα προγραμματα σαν το R15 γιατι αυτο ειναι και λιγο παλιο και το πιο διασημο.

Δημοσ.

Δεν σε είδα να λαμβάνεις υπόψην σου αυτή τη μέτρηση αλλά την άλλη με το ccx κλειστό.

 

Για αυτό κι εγώ έβαλα μάλλον(?) γιατί στην πρώτη μέτρηση δεν μέτρησε με το smt κλειστό ώστε να είμαι σίγουρος, αλλά μπήκα στη διαδιακασία να υποθέσω:

 

ότι με το smt ανοιχτό σκοράρει λίγο παραπάνω άρα μπορεί (για αυτό και το ερωτηματικό)

και με το smt κλειστό να βγάζει λίγο παραπάνω  (δεν το είδα, εύλογη υπόθεση είναι)

 

 

Εσύ που τα ξέρεις αυτά κύριε καθηγητά γιατί μου έβαλες τη μέτρηση με το κλειστό ccx?

 

Γιατί το ST Score με σταθερά Clocks (πχ 4GHz) μετράει το IPC ενώ όταν έχεις ενεργοποιημένα τα SMT/HT/CMT μετράει Troughput. 

 

Άμα τρέξεις δυο ST από ένα CCX το καθένα, πάλι Throughput μετράς και όχι IPC. 

Δημοσ.

Μπράβο και σου ξαναγράφω κ καθηγητά, σύγκρινα το συνολικό

έβαλα κι ενα ερωτηματικό παρέα με ένα μάλλον υποθέτωντας την μέτρηση χωρίς smt.

Την άλλη με το ccx κλειστό ούτε που την κοίταξα και περισσότερο απ όλους ούτε εσύ θα έπρεπε να την κοιτάς.

Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε

Πρέπει να είστε μέλος για να αφήσετε σχόλιο

Δημιουργία λογαριασμού

Εγγραφείτε με νέο λογαριασμό στην κοινότητα μας. Είναι πανεύκολο!

Δημιουργία νέου λογαριασμού

Σύνδεση

Έχετε ήδη λογαριασμό; Συνδεθείτε εδώ.

Συνδεθείτε τώρα
  • Δημιουργία νέου...