AMD Ryzen Threadriper - X399

kostas_anes · 17 Οκτωβρίου 2018

4 λεπτά πριν, james rod είπε

πολυ θα ηθελα να μαθω πως βγαζεις αυτα τα συμπερασματα για το ipc.

IPC ανθρωπε μου ετσι μετρας. Βαζεις ιδιο χρονισμο σε 2 επεξεργαστες με εναν πυρηνα και μετρας. To ποσους πυρηνες εχεις δεν μας ενδιαφερει. Ο καθε πυρηνας το ιδιο IPC εχει...

Πέτρος · 17 Οκτωβρίου 2018

Don't feed plz...νισάφι!

adtakhs · 17 Οκτωβρίου 2018

45 λεπτά πριν, james rod είπε

πολυ θα ηθελα να μαθω πως βγαζεις αυτα τα συμπερασματα για το ipc.

Ορίστε κύριε. I7 7820X VS 2700X και οι δύο στα 4Ghz .

Δηλαδή ένας SKYLAKE -X με QUAD CHANNEL και MESI με 8-ΠΥΡΗΝΕΣ , απέναντι σε έναν ZEN+ με DUAL CHANNEL (ελαφρύ bottlenck σε memory intensive σενάρια σε σχέση με έναν RIPPER) και INFINITY FABRIC και 8-ΠΥΡΗΝΕΣ.

Και οι δυο στα 4GHZ με ίδιο αριθμό πυρήνων .

Μια γεύση από IPC ....

Επεξ/σία 17 Οκτωβρίου 2018 από adtakhs

GeorgeMan · 17 Οκτωβρίου 2018

2 hours ago, adtakhs said:

Τι να κλάσουν τα +400Mhz υψηλότερα ρολόγια βάσης όταν ο άλλος έχει καλύτερο SMT και διπλάσιους πυρήνες ενώ και αυτός κρατά υψηλούς χρονισμους?

Όταν ο 2990Wx θα παίζει με 16-18 πυρήνες, τότε τα ρολόγια θα είναι στο boost (μισο φορτίο από τα 32cores) ενώ του intel θα έχουν πέσει στα base....

Πλάκα μου κάνεις?

Πάρτι με ούζα κερνάει η AMD εδώ και ένα χρόνο. Βασικά ότι θέλει κάνει στο Hdet.

Παίζει σε ότι τιμή θέλει χωρίς χασουρα, μπορεί να δωσει έως και 8-channel IMC οπότε της κ@υλωσει κ.λ.π.

Το θέμα είναι ότι στην εταιρεία αγοράζουμε παραδοσιακά intel servers με το κιλό (μιλάμε για dual cpu μηχανάκια με δύο 8πύρηνους xeon και 128GB DDR4 ECC reg ram τουλάχιστον) και δεν σκέφτεται ΚΑΝ κανείς να πάει σε AMD. Εκεί χωλαίνει και όχι στο προϊόν η AMD αυτή τη στιγμή...

Επεξ/σία 17 Οκτωβρίου 2018 από GeorgeMan

kostas_anes · 17 Οκτωβρίου 2018

18 λεπτά πριν, GeorgeMan είπε

Το θέμα είναι ότι στην εταιρεία αγοράζουμε παραδοσιακά intel servers με το κιλό (μιλάμε για dual cpu μηχανάκια με δύο 8πύρηνους xeon και 128GB DDR4 ECC reg ram τουλάχιστον) και δεν σκέφτεται ΚΑΝ κανείς να πάει σε AMD. Εκεί χωλαίνει και όχι στο προϊόν η AMD αυτή τη στιγμή...

Aνοιξε καμπανια για EPYC

Zaknafein · 17 Οκτωβρίου 2018

4 ώρες πριν, adtakhs είπε

STP έχεις λόγω single boost ρολογιών

Καλό είναι να διαβάζεις λίγο πιο προσεκτικά αγαπητέ Τάκη, γενικά για το STP μίλησα, όχι για ρολόγια και όχι για σύγκριση intel vs amd hedt (η οποία είναι αστεία όταν ο 16/32 1950Χ έχει 750€ και ο 10/20 7900Χ 900€, πλην κάποιων πολύ specific senarios).

Οι εξτρά πυρήνες δεν κάνουν μαγικά, πολλαπλασιαστής του STP είναι, όπως και το SMT, οπότε δεν μπορείς να αγνοείς το STP, αφενός μεν γιατί δεν είναι όλα τα tasks παράλληλα (εκτός αν το HEDT είναι code για render nodes και τπτ άλλο) και αφετέρου γιατί το σύνολο σε mt tasks θα προκύψει ως πολλαπλάσιο του STP.

adtakhs · 17 Οκτωβρίου 2018

9 λεπτά πριν, Zaknafein είπε

Καλό είναι να διαβάζεις λίγο πιο προσεκτικά αγαπητέ Τάκη, γενικά για το STP μίλησα, όχι για ρολόγια και όχι για σύγκριση intel vs amd hedt (η οποία είναι αστεία όταν ο 16/32 1950Χ έχει 750€ και ο 10/20 7900Χ 900€, πλην κάποιων πολύ specific senarios).

Οι εξτρά πυρήνες δεν κάνουν μαγικά, πολλαπλασιαστής του STP είναι, όπως και το SMT, οπότε δεν μπορείς να αγνοείς το STP, αφενός μεν γιατί δεν είναι όλα τα tasks παράλληλα (εκτός αν το HEDT είναι code για render nodes και τπτ άλλο) και αφετέρου γιατί το σύνολο σε mt tasks θα προκύψει ως πολλαπλάσιο του STP.

Μια χαρά διάβασα.

Ξαναλέω πως οι Skylake παίζουν μέχρι 4.4ghz , το ίδιο και οι Ripper.

Αυτό σημαίνει πως έχουν. Και παρόμοιο STP.

To IPC είναι παρόμοιο και δεν έχουν διαφορά στις συχνότητες.

Πέρα από αυτό, όταν μιλάμε για Server δεν θα δεις να τρέχουν με ένα πυρήνα load ώστε να μπουν τα single boost ρολογια το ίδιο και σε HDET.

Επεξ/σία 17 Οκτωβρίου 2018 από adtakhs

narta · 17 Οκτωβρίου 2018

38 λεπτά πριν, Zaknafein είπε

Οι εξτρά πυρήνες δεν κάνουν μαγικά, πολλαπλασιαστής του STP είναι, όπως και το SMT, οπότε δεν μπορείς να αγνοείς το STP, αφενός μεν γιατί δεν είναι όλα τα tasks παράλληλα (εκτός αν το HEDT είναι code για render nodes και τπτ άλλο) και αφετέρου γιατί το σύνολο σε mt tasks θα προκύψει ως πολλαπλάσιο του STP.

Απο την αλλη ειναι εως ανοητο σε HEDT πλατφορμα να δινεις υπερτατο βαρος στο stp μιας και αν σου ειναι τοσο σημαντικο εισαι σε λαθος πλατφορμα.

Και δεν ειναι τοσο απλα τα πραγματα οτι STP*C=MTP. Παιζουν χιλιαδες αλλες συνιστωσες (schedulers, TDP κοκ) που καθοριζουν την MTP ενος cpu. Αν ηταν τοσο απλα τα πραγματα θα εφτιαχναν τον πιο γρηγορο πυρηνα και μετα θα εκοβαν πυρηνες με το κιλο.

adtakhs · 17 Οκτωβρίου 2018

1 ώρα πριν, Zaknafein είπε

Καλό είναι να διαβάζεις λίγο πιο προσεκτικά αγαπητέ Τάκη, γενικά για το STP μίλησα, όχι για ρολόγια και όχι για σύγκριση intel vs amd hedt (η οποία είναι αστεία όταν ο 16/32 1950Χ έχει 750€ και ο 10/20 7900Χ 900€, πλην κάποιων πολύ specific senarios).

Οι εξτρά πυρήνες δεν κάνουν μαγικά, πολλαπλασιαστής του STP είναι, όπως και το SMT, οπότε δεν μπορείς να αγνοείς το STP, αφενός μεν γιατί δεν είναι όλα τα tasks παράλληλα (εκτός αν το HEDT είναι code για render nodes και τπτ άλλο) και αφετέρου γιατί το σύνολο σε mt tasks θα προκύψει ως πολλαπλάσιο του STP.

Επειδή πριν ήμουν από κινητό και δεν μπορούσα να το αναλύσω ας το ξαναγράψω.

Στο παρελθόν όπου οι επεξεργαστές έπαιζαν μόνιμα στην ονομαστική τους συχνότητα , που ΔΕΝ έκαναν Multithreading εντός του κάθε core (SMT- HYPERTHREADING) μπορούσες να πεις πως το Multithread performance ήταν πολλαπλάσιο του Single αν και τότε υπήρχαν και άλλα που μετρούσαν.

Σήμερα ανάμεσα στις δυο αρχιτεκτονικές θα δεις τα εξής.

Instruction per cycle per THREAD ο Intel 5% ταχύτερος του AMD .

Instrucrion per cycle per CORE o AMD 10% ταχύτερος του Intel σε έως 128bit.

Πάμε τώρα στο σύνολο του chip.

Εχεις έναν Skylake -Χ που μπουστάρει στα 4,4Ghz σε ένα πυρήνα με ένα Thread , όταν οι άλλοι είναι ανενεργοί . Εκεί έχει ένα A1 STP performance .

Εχεις έναν Skylake -Χ που μπουστάρει στα 4,4Ghz σε ένα πυρήνα με δυο Threads , όταν οι άλλοι είναι ανενεργοί . Εκεί έχει ένα A2 STP performance .

Εχεις και έναν Skylake-X που παίζει πχ. στα 3Ghz όταν και οι 18 πυρήνες είναι σε Load. Εκεί έχει ένα ΔΙΑΦΟΡΕΤΙΚΟ B STP performance από κάθε πυρήνα.

Εχεις έναν Ripper που μπουστάρει στα 4,4Ghz σε ένα πυρήνα όταν όλοι οι άλλοι είναι σε Idle. Εκεί έχει ένα Γ1 STP performance .

Εχεις έναν Ripper που μπουστάρει στα 4,4Ghz σε ένα πυρήνα με δυο Threads , όταν οι άλλοι είναι ανενεργοί (IDLE) . Εκεί έχει ένα Γ2 STP performance .

Εχεις και έναν Ripper που όταν loadάρει στους 18 από τους 32 πυρήνες παίζει στα 3,5Ghz . Εκεί έχει ένα διαφορετικό Δ STP performance.

Εχεις και έναν Ripper που όταν Loadάρει και τους 32 πυρήνες από τους 32 , παίζει στα 3Ghz . Εκεί έχεις ένα διαφορετικό Ε STP performance.

========================================================================================================================

Αν τα βάλεις κάτω τα παραπάνω ανά κατάσταση STP που σου έγραψα θα είναι κάπως έτσι:

A1 > Γ1

αλλά και Γ2 > Α2

και Δ > Β

και Ε > Β

Και όλα αυτά πολύ πολύ χοντρικά μιας και παίζουν ένα σωρό άλλα πράγματα ρόλο . Από το TDP limit (η περίπτωση Δ > Β εκεί βρίσκεται) , τα instruction sets κ.λ.π.

Επεξ/σία 17 Οκτωβρίου 2018 από adtakhs

Zaknafein · 17 Οκτωβρίου 2018

50 λεπτά πριν, narta είπε

Απο την αλλη ειναι εως ανοητο σε HEDT πλατφορμα να δινεις υπερτατο βαρος στο stp μιας και αν σου ειναι τοσο σημαντικο εισαι σε λαθος πλατφορμα.

Και δεν ειναι τοσο απλα τα πραγματα οτι STP*C=MTP. Παιζουν χιλιαδες αλλες συνιστωσες (schedulers, TDP κοκ) που καθοριζουν την MTP ενος cpu. Αν ηταν τοσο απλα τα πραγματα θα εφτιαχναν τον πιο γρηγορο πυρηνα και μετα θα εκοβαν πυρηνες με το κιλο.

Δεν είπα "υπέρτατο" βάρος. Είπα ότι δεν είναι αμελητέος παράγοντας, δεν καταλαβαίνω γιατί κολλήσατε και οι 2. Ανόητο είναι να νομίζεις ότι οι πυρήνες από μόνοι τους είναι πανάκεια, ειδικά όταν μεγάλο κομμάτι του s/w, θα αντιμετωπίσει τους >16c ως 16c.

Προφανώς και το MT scaling είναι περίπλοκο, αλλά το STP είναι το άνω όριο, δεν μπορείς να λες "STP, who cares?".

greg4 · 17 Οκτωβρίου 2018

2 ώρες πριν, GeorgeMan είπε

Το θέμα είναι ότι στην εταιρεία αγοράζουμε παραδοσιακά intel servers με το κιλό (μιλάμε για dual cpu μηχανάκια με δύο 8πύρηνους xeon και 128GB DDR4 ECC reg ram τουλάχιστον) και δεν σκέφτεται ΚΑΝ κανείς να πάει σε AMD. Εκεί χωλαίνει και όχι στο προϊόν η AMD αυτή τη στιγμή...

Και σε web servers δεν υπάρχει σχεδόν πουθενά για οτιδήποτε άλλο εκτός από intel. Αυτός εδώ μάλιστα είναι ίσως το πιο διάσημο cpu:

https://ark.intel.com/products/91767/Intel-Xeon-Processor-E5-2650-v4-30M-Cache-2_20-GHz

adtakhs · 17 Οκτωβρίου 2018

5 λεπτά πριν, greg4 είπε

Και σε web servers δεν υπάρχει σχεδόν πουθενά για οτιδήποτε άλλο εκτός από intel. Αυτός εδώ μάλιστα είναι ίσως το πιο διάσημο cpu:

https://ark.intel.com/products/91767/Intel-Xeon-Processor-E5-2650-v4-30M-Cache-2_20-GHz

H Intel έχει συμβόλαια με την DELL, LENOVO, HP οπότε η κατάσταση δεν αλλάζει εύκολα.

Επίσης ακούγεται πως για να μην μπει η AMD στην αγορά κάνει μεγάλες εκπτώσεις σε σχέση με την τιμή καταλόγου της .

Για να αλλάξει κάτι τέτοιο θέλει χρόνο.

Ισως τώρα που η Intel δεν προλαβαίνει την ζήτηση, οι OEMs να στραφούν και προς AMD ώστε να καλύψουν την ζήτηση για νέα μηχανάκια. Εκεί ίσως υπάρξει ευκαιρία για τους ZEN και την AMD να πάρει συμβόλαια.

Επεξ/σία 17 Οκτωβρίου 2018 από adtakhs

james rod · 17 Οκτωβρίου 2018

δεν υπαρχου αυτα τα νουτμερα που γραφεται. 10% λεει παραπανω ipc ο amd. ποτε το βρηκε αυτο?

ας δουμε μερικα bench μουσικα, που συνηθως χρησιμοποιουνται οι πλατφορμες αυτες. ο 7900χ διαλυει τον 1950χ.

https://techreport.com/review/32390/amd-ryzen-threadripper-1920x-and-ryzen-threadripper-1950x-cpus-reviewed/14

τωρα μετρηση ipc σε cannon lake. προσεξτε τι λεει και καποιες απο τις ερωτησεις που απανταει απο κατω στο φορουμ.

https://www.reddit.com/r/intel/comments/9o8o55/cannon_lake_review/

adtakhs · 17 Οκτωβρίου 2018

10 λεπτά πριν, james rod είπε

δεν υπαρχου αυτα τα νουτμερα που γραφεται. 10% λεει παραπανω ipc ο amd. ποτε το βρηκε αυτο?

The Ryzen has a micro-operation cache which can hold 2048 micro-operations or instructions. This is sufficient to hold the critical innermost loop in most programs. There has been discussions of whether the Ryzen would be able to run four instructions per clock cycle or six, because the documents published by AMD were unclear at this point. Well, my testing shows that it was not four, and not six, but five. As long as the code is running from the micro-operations cache, it can execute five instructions per clock, where Intel has only four. Code that doesn't fit into the micro-operations cache run from the traditional code cache at a maximum rate of four instructions per clock. However, the rate of fetching code from the code cache is not 32 bytes per clock, as some documents seem to indicate, but mostly around 16 bytes per clock. The maximum I have seen is 17.3 bytes per clock. This is a likely bottleneck since most instructions in vector code are more than four bytes long.

The combination of a compare instruction and a conditional jump can be fused together into a single micro-op. This makes it possible to execute a tiny loop with up to six instructions in one clock cycle per iteration. Except for tiny loops, the throughput for jumps is one jump per two clock cycles if the jump is taken, or two not-taken jumps per clock cycle.

256-bit vector instructions (AVX instructions) are split into two micro-ops handling 128 bits each. Such instructions take only one entry in the micro-operation cache. A few other instructions also generate two micro-ops. The maximum throughput of the micro-op queue after the decoders is six micro-ops per clock. The stream of micro-ops from this queue are distributed between ten pipelines: four pipes for integer operations on general purpose registers, four pipes for floating point and vector operations, and two for address calculation. This means that a throughput of six micro-ops per clock cycle can be obtained if there is a mixture of integer and vector instructions.

Let us compare the execution units of AMD's Ryzen with current Intel processors. AMD has four 128-bit units for floating point and vector operations. Two of these can do addition and two can do multiplication. Intel has two 256-bit units, both of which can do addition as well as multiplication. This means that floating point code with scalars or vectors of up to 128 bits will execute on the AMD processor at a maximum rate of four instructions per clock (two additions and two multiplications), while the Intel processor can do only two. With 256-bit vectors, AMD and Intel can both do two instructions per clock. Intel beats AMD on 256-bit fused multiply-and-add instructions, where AMD can do one while Intel can do two per clock. Intel is also better than AMD on 256-bit memory writes, where Intel has one 256-bit write port while the AMD processor has one 128-bit write port. We will soon see Intel processors with 512-bit vector support, while it might take a few more years before AMD supports 512-bit vectors. However, most of the software on the market lags several years behind the hardware. As long as the software uses only 128-bit vectors, we will see the performance of the Ryzen processor as quite competitive. The AMD can execute six micro-ops per clock while Intel can do only four. But there is a problem with doing so many operations per clock cycle. It is not possible to do two instructions simultaneously if the second instruction depends on the result of the first instruction, of course. The high throughput of the processor puts an increased burden on the programmer and the compiler to avoid long dependency chains. The maximum throughput can only be obtained if there are many independent instructions that can be executed simultaneously.

This is where simultaneous multithreading comes in. You can run two threads in the same CPU core (this is what Intel calls hyperthreading). Each thread will then get half of the resources. If the CPU core has a higher capacity than a single thread can utilize then it makes sense to run two threads in the same core. The gain in total performance that you get from running two threads per core is much higher in the Ryzen than in Intel processors because of the higher throughput of the AMD core (except for 256-bit vector code).

Επεξ/σία 17 Οκτωβρίου 2018 από adtakhs

james rod · 17 Οκτωβρίου 2018

11 λεπτά πριν, greg4 είπε

Και σε web servers δεν υπάρχει σχεδόν πουθενά για οτιδήποτε άλλο εκτός από intel. Αυτός εδώ μάλιστα είναι ίσως το πιο διάσημο cpu:

https://ark.intel.com/products/91767/Intel-Xeon-Processor-E5-2650-v4-30M-Cache-2_20-GHz

καπου ειχα διαβασει οτι δε γινεται, ειδικα σε vm να στησεις απο μια εταιρεια στην αλλη, γι' αυτο αναβαθμιζουν συνεχεια απο μια. αν το βρω θα το ανεβασω. κοιτα εδω τι εγινε ας πουμε. τους εστησαν καστομ επεξεργαστες για να μην πανε σε arm.

https://blog.cloudflare.com/a-tour-inside-cloudflares-g9-servers/

Σύνδεση

AMD Ryzen Threadriper - X399

Προτεινόμενες αναρτήσεις

kostas_anes

Συχνή συμμετοχή στο θέμα

Δημοφιλείς Ημέρες

Συχνή συμμετοχή στο θέμα

Δημοφιλείς Ημέρες

Δημοφιλή Μηνύματα

ZahosDoganos

ZahosDoganos

renaxan

Δημοσιευμένες Εικόνες

Πέτρος

adtakhs

GeorgeMan

kostas_anes

Zaknafein

adtakhs

narta

adtakhs

Zaknafein

greg4

adtakhs

james rod

adtakhs

james rod

Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε

Δημιουργία λογαριασμού

Σύνδεση

ZahosDoganos

ZahosDoganos

renaxan

Σύνδεση