adtakhs Δημοσ. 21 Αυγούστου 2016 Δημοσ. 21 Αυγούστου 2016 Εσένα πόσα σου δίνουν;Μπας και αξίζει να αλλάξω μεριά. Δηλαδή σοβαρά τώρα,μια εταιρία που εδώ και καμιά 10 χρόνια δεν βγάζει τίποτα άλλο από μικρούς πυρήνες σε μεγάλες ποσότητες, και στης κάρτες γραφικών και στους επεξεργαστές,δεν ασχολήθηκε ποτέ με HT αλλά όλο χαρά καταβροχθίζετε την προπαγάνδα sorry marketing της AMD. Επεξεργαστές για server και για κονσόλες βγάζει ρε παιδιά,αν πράγματι θα έχουν μεγάλους πυρήνες με HT θα χάσουν την αγορά των κονσολών και στους server θα πρέπει να παίζουν με πολύ μικρό margin για να επικρατήσουν με προϊόν που είναι παρόμοιο με αυτά της intel. Όσο μεγάλο ήταν το module του bulldozer, τόσο μεγάλος θα είναι και ο πυρήνας του Zen και λίγο μεγαλύτερος ίσως. Απλά αντί για 2 πυρήνες με κοινή fpu, εδώ υπάρχει ένας πυρήνας που θα κάνει hyperthreading. Αυτό θα δώσει υψηλό single core αφού όλος ο πυρήνας θα μπορεί να εκμεταλλευτεί από ένα νήμα αν χρειαστεί , πράγμα που δεν γινόταν στο module (2-πυρηνες), ενώ μάλλον θα χάσει σε παραλληλισμό νημάτων λίγο σε σχέση με τον σχεδιασμό των modules του bd. Από την στιγμή όμως που πάει στα 14nm και βάζει διπλάσια cores απ ότι τα modules του bd, αυτό δεν θα φανεί στο τελικό chip. Το ωραίο ξέρεις ποιο θα είναι? Να έχει κάνει τέτοιο σχεδιασμό ή amd που το hyperthreading της να είναι ανώτερο από το 15 ετών της intelas.... Χαχαχα εδώ θα πέσει πολύ γέλιο 2
Aten-Ra Δημοσ. 21 Αυγούστου 2016 Δημοσ. 21 Αυγούστου 2016 Από της εικόνες τουλάχιστον όχι, το steamroller γιατί το ονομάζουν core αλλά δείχνει module; Στους ZEN ποιος σου είπε ότι δεν ακολουθούν ίδια τακτική; Για όποιους δεν κατάλαβαν την διαφορά έφτιαξα το παρακάτω γράφημα. Η διαφορά όπως φαίνεται στο γράφημα είναι ότι στον Bulldozer όταν έχουμε ένα νήμα (Thread 1) τότε μπορεί να χρησιμοποιήσει MONO το ένα Integer που έχει μόνο 2x ALU και όλο το FPU. Στον ΖΕΝ, όταν έχουμε μόνο ένα νήμα (Single Thread) τότε μπορεί να χρησιμοποιήσει όλο το Integer με τα 4x ALU, δηλαδή έχει διπλάσια ALU από ότι στον Bulldozer. Όταν έχουμε όμως δυο νήματα (Dual Thread), o Bulldozer με το CMT μπορεί να χρησιμοποιήσει και τα δυο Integer με 2x ALU ανά νήμα με σύνολο 4x ALU ανά Module (Throughput). Στον ΖΕΝ και τα δυο νήματα μπορούν να χρησιμοποιήσουν όλο τον πυρήνα (Integer + FPU) αλλά το δεύτερο νήμα θα χρησιμοποιήσει ότι ALU και FPU έχουν περισσέψει από το πρώτο νήμα. Δηλαδή αν το πρώτο νήμα χρησιμοποιήσει 3x ALU, τότε το δεύτερο νήμα μπορεί να χρησιμοποιήσει μόνο 1x ALU. 2
John-lamia Δημοσ. 21 Αυγούστου 2016 Δημοσ. 21 Αυγούστου 2016 Aten-ra απ ότι κατάλαβα δεν έχει κάτι καινούριο σαν αρχιτεκτονική. Το μόνο πρόβλημα ήταν τα 28nm στην amd. Ξέρουμε ποιά καινούρια σετ εντολών θα βάλουν στους ζεν ;
adtakhs Δημοσ. 21 Αυγούστου 2016 Δημοσ. 21 Αυγούστου 2016 Aten-ra απ ότι κατάλαβα δεν έχει κάτι καινούριο σαν αρχιτεκτονική. Το μόνο πρόβλημα ήταν τα 28nm στην amd. Ξέρουμε ποιά καινούρια σετ εντολών θα βάλουν στους ζεν ; Μα όλο καινούριο είναι.Άλλος memory controller Άλλο chip/north Άλλη cache Άλλο front/end, εδώ μπαίνει και το hyperthreading. Διαφορετικές μεγαλύτερες IEU θυμίζουν εποχές Κ8/ Κ10. Άλλη FPU Και ίσως και άλλες αλλαγές που εκ πρώτης όψεως δεν φαίνονται ή δεν τις δείχνουν ακόμα. Τα 28nm vs 14nm είναι για να βάλει περισσότερους πυρήνες στο ίδιο tdp και να έχει ίσως χαμηλότερη κατανάλωση σε idle. 1
TheELF Δημοσ. 21 Αυγούστου 2016 Δημοσ. 21 Αυγούστου 2016 Για όποιους δεν κατάλαβαν την διαφορά έφτιαξα το παρακάτω γράφημα.Δηλαδή το 40% προέρχεται από τα δυο παραπάνω ALU (και άλλες μικρο αλλαγές) αυτό δεν σημαίνει ότι αν μια εφαρμογή δεν μπορεί να χρησιμοποιήσει πάνω από 2 ALU το 40% πάνω είναι φαντασίωση; Η AMD έριξε τα ALU από 3 σε 2 στους FX γιατί και καλά έμενε άχρηστο το τρίτο στο προηγούμενο design. Με λίγα λόγια αν δεν θα τρέχουν 2 νήματα στον ίδιο πυρήνα για να καλύψουν και τα 4 ALU τότε τι ταχύτητες θα έχει σε single core που θα τρέχει single thread;
adtakhs Δημοσ. 21 Αυγούστου 2016 Δημοσ. 21 Αυγούστου 2016 Δηλαδή το 40% προέρχεται από τα δυο παραπάνω ALU (και άλλες μικρο αλλαγές) αυτό δεν σημαίνει ότι αν μια εφαρμογή δεν μπορεί να χρησιμοποιήσει πάνω από 2 ALU το 40% πάνω είναι φαντασίωση; Η AMD έριξε τα ALU από 3 σε 2 στους FX γιατί και καλά έμενε άχρηστο το τρίτο στο προηγούμενο design. Με λίγα λόγια αν δεν θα τρέχουν 2 νήματα στον ίδιο πυρήνα για να καλύψουν και τα 4 ALU τότε τι ταχύτητες θα έχει σε single core που θα τρέχει single thread; Στους bd αφαίρεσε τα 2 alu/agu αλλά τα πρόσθεσε στον δεύτερο πυρηνα του module οπότε αν δεις στο σύνολο το ζεν core και το bd module συνολικά έχει αφαιρέσει ALUs/agus, ενώ τευτοχρονα έχει διπλασιάσει την FPU ανά core.Αυτό λογικά έχει αφαιρεσει δύναμη από τον zen σε συνολική ισχύ του integer αλλά έχει προσδώσει μεγαλύτερη χρηστικότητα. Οι bd είχαν δυνατότερο integer στο module αλλά για να πάρεις την ισχύ ήθελες 2 νήματα Το τρίτο ALUs πλέον δουλεύει μέσω hyperthreading, αν δεν χρειάζονται όλα τα alus απο το core. Στην K10 ήταν που έμενε ανεκμετάλλευτο. Ή AMD δεν είχε θέμα με την ποιότητα των ALUs στο core, με το βαθύ pipeline είχε και με την αργή cache, το prediction κ.λ.π.
TheELF Δημοσ. 21 Αυγούστου 2016 Δημοσ. 21 Αυγούστου 2016 Οι bd είχαν δυνατότερο integer στο module αλλά για να πάρεις την ισχύ ήθελες 2 νήματα Το τρίτο ALUs πλέον δουλεύει μέσω hyperthreading, αν δεν χρειάζονται όλα τα alus απο το core. Και στους ZEN δηλαδή αν ένα πρόγραμμα δεν χρειάζεται 4 integer ALU θα χρειάζεσαι 2 νήματα,το ίδιο πράμα λέμε. Δεν ανεβαίνει δηλαδή η ταχύτητα που έχει ο πυρήνας,απλά ένωσαν ένα Module (ή έστω το μεγαλύτερο μέρος του) σε έναν πυρήνα αυξάνοντας έτσι το IPC του πυρήνα αλλά συνεχίζεις να χρειάζεσαι και τα δύο νήματα του SMT για να το αξιοποιήσεις,εκτός από προγράμματα Distributed computing που θα μπορούσαν να τους δουλέψουν όλους με ένα μόνο νήμα, αν βέβαια μπορεί να κλείσει το SMT και να δείξει όλα τα ALU σαν έναν πυρήνα. Πρέπει να περιμένουμε να δούμε αν θα μπορεί να δουλεύει σαν το Hyperthreading ή αν απλά κόβει τον πυρήνα στα δύο εξαρχής όπως λέγατε εσείς οι ίδιοι παλιά για το πως δουλεύει το HT.
adtakhs Δημοσ. 21 Αυγούστου 2016 Δημοσ. 21 Αυγούστου 2016 Δεν θα κόβει τον πυρήνα στα δύο από την αρχή, γιατί πολύ απλά δεν θα μιλάμε για ένα πυρήνα αλλά για 2. Το Ht απλά θα μπορεί να δουλέψει τους μη απαιτούμενους πόρους του 1ου νήματος από ένα δεύτερο ώστε να δώσει στους διαθέσιμους πόρους του core την μέγιστη χρηστικότητα. Τώρα το τι άλλες αλλαγες έχουν κάνει στα alus δεν το ξέρουμε. Μόνο την ποσότητα ξέρουμε. Λογικα θα έχουν προχωρήσει και σε άλλες αλλαγές για βελτίωση στα σημεία. Τέλος το single thr. Performance δεν θα εξαρτηθεί μόνο από τα alus αλλά περισσότερο από το front/end και θα έχει να κάνει με το prediction, το decode, την cache. Από εκεί θα έρθει μέρος της αύξησης του ipc λογικά.
Aten-Ra Δημοσ. 21 Αυγούστου 2016 Δημοσ. 21 Αυγούστου 2016 Δηλαδή το 40% προέρχεται από τα δυο παραπάνω ALU (και άλλες μικρο αλλαγές) αυτό δεν σημαίνει ότι αν μια εφαρμογή δεν μπορεί να χρησιμοποιήσει πάνω από 2 ALU το 40% πάνω είναι φαντασίωση; Η AMD έριξε τα ALU από 3 σε 2 στους FX γιατί και καλά έμενε άχρηστο το τρίτο στο προηγούμενο design. Με λίγα λόγια αν δεν θα τρέχουν 2 νήματα στον ίδιο πυρήνα για να καλύψουν και τα 4 ALU τότε τι ταχύτητες θα έχει σε single core που θα τρέχει single thread; Και στους ZEN δηλαδή αν ένα πρόγραμμα δεν χρειάζεται 4 integer ALU θα χρειάζεσαι 2 νήματα,το ίδιο πράμα λέμε. Δεν ανεβαίνει δηλαδή η ταχύτητα που έχει ο πυρήνας,απλά ένωσαν ένα Module (ή έστω το μεγαλύτερο μέρος του) σε έναν πυρήνα αυξάνοντας έτσι το IPC του πυρήνα αλλά συνεχίζεις να χρειάζεσαι και τα δύο νήματα του SMT για να το αξιοποιήσεις,εκτός από προγράμματα Distributed computing που θα μπορούσαν να τους δουλέψουν όλους με ένα μόνο νήμα, αν βέβαια μπορεί να κλείσει το SMT και να δείξει όλα τα ALU σαν έναν πυρήνα. Πρέπει να περιμένουμε να δούμε αν θα μπορεί να δουλεύει σαν το Hyperthreading ή αν απλά κόβει τον πυρήνα στα δύο εξαρχής όπως λέγατε εσείς οι ίδιοι παλιά για το πως δουλεύει το HT. Διάβασε λίγο τι γράφουν τα slide και θα καταλάβεις ότι ο ZEN θα χρησιμοποίει πάντα περισσότερα ALU από ότι ο Bulldozer (Μεγαλύτερο ILP). Τα Slides αναφέρουν τι επεμβάσεις έχουν κάνει στον ZEN για να έχει μεγαλύτερο IPC. Επίσης να προσθέσω ότι το τρίτο ALU στους STAR (Thuban) δεν έμενε άχρηστο, άπλα οι πυρήνες STAR μπορούσαν να κάνουν Compute (ALU) μέχρι 3 αλλά μόνο 2 Retire ανά cycle. Στους Bulldozer μπορουν να κάνουν 2x Compute (ALU) και 2x Retire. Στους ΖΕΝ φαίνεται να μπορούν να κάνουν 4x Compute (ALU) και 4x Retire αλλά ακόμα δεν είναι 100% αποσαφηνισμένο.
TheELF Δημοσ. 21 Αυγούστου 2016 Δημοσ. 21 Αυγούστου 2016 Δεν θα κόβει τον πυρήνα στα δύο από την αρχή, γιατί πολύ απλά δεν θα μιλάμε για ένα πυρήνα αλλά για 2.Άααααντε ρε,ε τι λέω τόση ώρα;Το Ht απλά θα μπορεί να δουλέψει τους μη απαιτούμενους πόρους του 1ου νήματος από ένα δεύτερο ώστε να δώσει στους διαθέσιμους πόρους του core την μέγιστη χρηστικότητα.Ναι το HT δουλεύει έτσι,είδες εσύ πουθενά να μιλάει η AMD για HT;Το ότι το HT είναι είδος SMT δεν σημαίνει ότι κάθε είδος SMT είναι αυτομάτως και HT. Διάβασε λίγο τι γράφουν τα slide και θα καταλάβεις ότι ο ZEN θα χρησιμοποίει πάντα περισσότερα ALU από ότι ο Bulldozer (Μεγαλύτερο ILP). Τα Slides αναφέρουν τι επεμβάσεις έχουν κάνει στον ZEN για να έχει μεγαλύτερο IPC. Μιλάς για τα αντίστοιχα με αυτά; Αν ήταν έτσι και οι skylake θα είχαν τρομερή διαφορά σε ταχύτητα του πυρήνα,αλλά και αυτοί έχουν μόνο μεγάλη αύξηση όταν τρέχουν πάνω από ένα νήμα ανά πυρήνα. Κάτι που για εσάς βέβαια είναι ανύπαρκτο και κλέψιμο επειδή δεν τα βλέπετε στα distributed computing benchmarks. Τώρα, επειδή τα λέει η AMD,ξαφνικά θα κάνουν την τεράστια διαφορά; http://www.anandtech.com/show/9582/intel-skylake-mobile-desktop-launch-architecture-analysis/5
adtakhs Δημοσ. 22 Αυγούστου 2016 Δημοσ. 22 Αυγούστου 2016 Ο πυρήνα elf είναι ενιαίος. Οπότε μπορεί να τον εκμεταλλευτεί ολόκληρο το ένα νήμα αν τον χρειαστεί ή μέρος του πυρήνα να τρέξει από το δεύτερο νήμα. Οπότε δεν υπάρχει περίπτωση να κόβεται μόνιμα στα δύο το core, αλλά θα εξαρτάται από τις απαιτήσεις του πρώτου νήματος. Αυτή είναι και η ουσιώδης διάφορα του CMT που είχε στυς excavator με τους διπλούς decode και τα δύο IEU σε σχέση με το SMT. Σίγουρα σε παραλληλισμό νημάτων ο Zen θα είναι χειρότερος ανά πυρήνα από το να ήταν φτιαγμένος σε CMT δομή , αλλά θα είναι δυνατότερος σε μόνο νήμα από την στιγμή που όλο το core θα είναι διαθέσιμο για χρήση. Ή μειωμένη απόδοση σε παραλληλισμό ανα πυρήνα δεν θα φανεί καθόλου όμως από την στιγμή που το chip λόγω 14nm θα εξοπλιστεί με 8 μεγάλους πυρηνες, περίπου όσο το κάθε ένα από τα 4 modules των FX. Τέλος δεν θα πρέπει να ξεχνάς το γεγονός της διπλάσιας FPU ανά core που θα έχουν οι zen σε σχέση με τους bozers. 1
Str Δημοσ. 22 Αυγούστου 2016 Δημοσ. 22 Αυγούστου 2016 ωρε, όλοι οι μηχανικοί υπολογιστών εδώ μαζέφτηκαν... 1
NT1G Δημοσ. 22 Αυγούστου 2016 Δημοσ. 22 Αυγούστου 2016 Φαίνεται να διέρρευσαν slides της αυριανής παρουσίασης της AMD στο Hot Chips: A Symposium on High Performance Chips. Εδώ π.χ. βλέπουμε ένα καράfake slide που λέει οτι έχει SMT με δυνατότητα χρήσης όλου του πυρήνα από 1 thread... Οι παραχαράκτες έχουν βελτιωθεί απίστευτα... 4
TheELF Δημοσ. 22 Αυγούστου 2016 Δημοσ. 22 Αυγούστου 2016 Ο πυρήνα elf είναι ενιαίος. Οπότε μπορεί να τον εκμεταλλευτεί ολόκληρο το ένα νήμα αν τον χρειαστεί ή μέρος του πυρήνα να τρέξει από το δεύτερο νήμα. ... ... ... Τέλος δεν θα πρέπει να ξεχνάς το γεγονός της διπλάσιας FPU ανά core που θα έχουν οι zen σε σχέση με τους bozers. Ναι ωραία,έχεις υπόψιν κάνα φυσιολογικό νήμα που θα μπορεί να εκμεταλλευτεί τα διπλάσια integer και τα διπλάσια FPU από αυτά του EX core; Ή απλά γίνεται αυτό για να έχει όμορφα νούμερα σε τίποτα CB single για να κάνει πουλήσεις σε άτομα που έτσι θα παραμυθιαστούν ότι θα τρέχουν όλα έτσι;
Aten-Ra Δημοσ. 22 Αυγούστου 2016 Δημοσ. 22 Αυγούστου 2016 Ναι ωραία,έχεις υπόψιν κάνα φυσιολογικό νήμα που θα μπορεί να εκμεταλλευτεί τα διπλάσια integer και τα διπλάσια FPU από αυτά του EX core; Ή απλά γίνεται αυτό για να έχει όμορφα νούμερα σε τίποτα CB single για να κάνει πουλήσεις σε άτομα που έτσι θα παραμυθιαστούν ότι θα τρέχουν όλα έτσι; Δηλαδή το υψηλό Single Thread που έχει η Intel είναι προπαγάνδα ?? Προφανώς δεν γνωρίζεις για ILP, Super-Scalar, OoO και Micro-Ops, θα σου συνιστούσα να διαβάσεις λίγο για αυτά και μετά ξαναέλα να συνεχίσουμε. 5
Προτεινόμενες αναρτήσεις