Προς το περιεχόμενο

Piledriver preview


Προτεινόμενες αναρτήσεις

Είναι multitak και όχι multithread.

 

Αρα όταν τρέχεις σε ένα πυρήνα ένα νήμα δουλεύει όπως το superpi !

 

Αν τρέξεις σε 8 νήματα θα είναι σαν να ανοίγει 8 X SUPER PI . ενα για κάθε core !

 

Στους THUBAN κάθε πυρήνας ήταν ξεχωριστός (front end) ενώ στους FX είναι modules με κοινό front end ! Το κοινό fron end όταν μπουκώνεις το cpu και του ζητάς να ταίσει όλα τα cores έχει πτώση επιδόσεων !!

 

Η AMD έλεγε πως το CMT είναι To 80% της ισχύος σε σχέση με το να είχεις 2 ξεχωριστούς πυρήνες !

 

Αρα όταν στον FX ζητήσεις να τρέξει σε 8-cores θα καθυστερήσει να τρέξει γιατί πέφτει η απόδοση του κάθε πυρήνα λόγω κοινού front end, δεν ταίζεται σωστά (γρήγορα)

 

Στους PHENOM δεν υπήρχε θέμα.

  • Like 1
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

δηλαδή έχουμε σφινομπουκαλιασμα στην νοοτροπία και στον τρόπο σκέψης

στην αρχιτεκτονική fx.

 

δηλαδή θα έπρεπε το κάθε core να έχει το δικό του module ώστε να μπορούσε να δουλεύει η όλη cpu 100% όταν αυτή δέχεται φόρτο εργασιασ στο 100%.

 

παντωσ έτσι οπωσ μου τα λεσ περισσότερο μηχανολογικό δείχνει το πρόβλημα παρά θέμα software.

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Τέλος πάντων δεν συζητούσαμε για αυτό. 

Βάλε το y-cruncher  και θα σου τα πει όλα. Είναι σύγχρονο πρόγραμμα με SSE3 και όχι x87 και όσο multithreaded γίνεται.

Θα σου πει και την απόδοση στο multithreading και έχει και σχέση με την πραγματική ζωή, αφού χρησιμοποιεί σύγχρονα σετ εντολών, σαν αυτά του Photoshop, x264 κλπ.

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

δηλαδή έχουμε σφινομπουκαλιασμα στην νοοτροπία και στον τρόπο σκέψης

στην αρχιτεκτονική fx.

 

δηλαδή θα έπρεπε το κάθε core να έχει το δικό του module ώστε να μπορούσε να δουλεύει η όλη cpu 100% όταν αυτή δέχεται φόρτο εργασιασ στο 100%.

 

παντωσ έτσι οπωσ μου τα λεσ περισσότερο μηχανολογικό δείχνει το πρόβλημα παρά θέμα software.

 

 

Nαι το πρόβλημα είναι σχεδιασμού και κατασκευής ! 

 

Για αυτό τον λόγο αναμένεται σε multithread καταστάσεις οι STEAMROLLER που θα έχουν δικό τους decoder και βελτίωση στο prediciton  να πιάσουν +30% απόδοση !

 

Δες παρακάτω τι αλλάζει !

 

AMD-Steamroller-vs-Bulldozer.jpg

 

Στον excavator που θα αυξήσουν και τα IEU σε μέγεθος θα έχουμε και πολύ υψηλότερο IPC.

 

Για να καταλάβεις σε απόλυτα νούμερα γιατί σε IPC είναι πίσω ο bulldozer από τον THUBAN κοίταξε τα IEU τους !

 

07.jpg

 

Κοίταξε πόσα INTEGER PIPELINES έχει ο THUBAN ανά core και πόσα ο BULL/PILEDRIVER/STEAMROLLER .

 

Στο module είναι περισσότερα αλλά δεν μπορούν να δουλέψουν σε single thread μαζί ... 

  • Like 1
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Ο αριθμός των integer pipelines από μόνος του δε λέει κάτι γιατί ο ένας από μόνος του μπορεί να έχει διαφορετικές λειτουργίες από έναν άλλον και να βγάζεις διαφορετικό efficiency με μια συγκεκριμένη διάταξη.

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Η σχεδίαση από την αρχή έτσι ήταν. Μειωμένο IPC αλλά πολύ μεγαλύτερες συχνότητες κι έτσι θα το υπερνικούσε.

Το πρόβλημα ήταν στο FrontEnd που δεν αρκούσε για να τροφοδοτήσει τους Integer πυρήνες. Αυτό το είχαν καταλάβει ακόμα και ερασιτέχνες. Τι σκεφτόντουσαν όταν το σχεδίασαν; 

Τώρα με ξεχωριστά τμήματα Decode/Dispatch θα δούμε μεγάλη βελτίωση.

Άμα βελτίωσαν και λιγάκι το Branch Prediction ακόμα καλύτερα. Αυτό είναι κρίσιμο σημείο σε μια σχεδίαση με τόσο βαθύ Pipeline. Χάνεις πολύ περισσότερα αν αστοχήσει στην πρόβλεψή του αυτό το τμήμα, από ότι θα έχανες σε έναν Phenom ας πούμε.

Για την μοιρασμένη FPU δεν υπάρχει λόγος ανησυχίας πάντως. Το σχέδιο ήταν από την αρχή να ατροφήσει και να αντικατασταθεί από το τμήμα γραφικών.

  • Like 3
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Η σχεδίαση από την αρχή έτσι ήταν. Μειωμένο IPC αλλά πολύ μεγαλύτερες συχνότητες κι έτσι θα το υπερνικούσε.

Το πρόβλημα ήταν στο FrontEnd που δεν αρκούσε για να τροφοδοτήσει τους Integer πυρήνες. Αυτό το είχαν καταλάβει ακόμα και ερασιτέχνες. Τι σκεφτόντουσαν όταν το σχεδίασαν; 

Τώρα με ξεχωριστά τμήματα Decode/Dispatch θα δούμε μεγάλη βελτίωση.

Άμα βελτίωσαν και λιγάκι το Branch Prediction ακόμα καλύτερα. Αυτό είναι κρίσιμο σημείο σε μια σχεδίαση με τόσο βαθύ Pipeline. Χάνεις πολύ περισσότερα αν αστοχήσει στην πρόβλεψή του αυτό το τμήμα, από ότι θα έχανες σε έναν Phenom ας πούμε.

Για την μοιρασμένη FPU δεν υπάρχει λόγος ανησυχίας πάντως. Το σχέδιο ήταν από την αρχή να ατροφήσει και να αντικατασταθεί από το τμήμα γραφικών.

 

 

To θέμα είναι πως αποδυνάμωσαν το single core προσπαθώντας να μειώσουν την κατανάλωση και να αυξήσουν τις IEU σε αριθμό για multithread,  αλλά αλλά μετά χρειάστηκαν να ανεβάσουν υπερβολικά ρολόγια οπότε .......

 

Αποτέλεσμα? Να έχεις μειωμένη single thread απόδοση σε σχέση με τους THUBAN και μεγαλύτερη κατανάλωση λόγω υψηλών ρολογιών !

 

Την AMD δεν την βοηθά τίποτα αυτή την εποχή. 

 

Είναι πίσω σε λιθογραφία 

Είναι πίσω σε single thread performance 

Και οι multithread εφαρμογές ψάχνονται ακόμα με το κιάλι ...

 

Για εμένα στους steamroller πέρα από τις αλλαγές στο front end, έπρεπε να δυναμώσουν πολύ τις IEU ...  

 

Δεν μπορώ να καταλάβω τι τα θέλουν τα 16MB CACHE στα desktop (μεγάλος χώρος) έχοντας τόσο μικρές IEU ... Χάνουν το παιχνίδι του single thread performance και όχι για 5-10% ... 

  • Like 1
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

καλα λεω γω οτι θα πρεπει να πεσει σε nm και να δωσει μεγαλη βαση στην δυναμη του καθε core. 
 

τα 8 cores μια χαρα ειναι, απλα θελουν δυναμη. 



σαν amd και θεμα εγωισμού και απ το κράξιμο που εχει φαει τοσο καιρο θα πρεπει στους καινούριους που θα βγαλει το καθε core να ειναι ποιο δυνατο απ ενος phenom στην ιδια συχνότητα. 

γιατι κακα τα ψεματα σε τετοιες φασεις παιζει μονη της μπαλα και χανει στον αγώνα, με θεατή την ιντελ  να φοραει κασκολ nvidia ετσι για ειρωνια.

 

θα πρεπει να δωσει αρκετη δυναμη στα cores και να φτιαξει και τον controler μνημης ο οποιος ειναι στα 1866 και τρωει ταπα απ τον controlel της ιντελ στα 1333.

κατι πρεπει να κανει με αυτα !!!! δεν γινεται να υπαρχει ελεγκτης μνημης σε τετοια συχνότητα και να καθεται !!!  

βλεπω Ι5 να ειναι μπροστα σε αναγνωση/εγγραφη οσο αναφορα την μνημη. 

 

δε θελουμε αλλα cores, ουτε μεγαλες συχνότητες οι οποιες ειναι ετσι απλα για τις εντυπώσεις.

θα πέσει σε νανομετρα για να σώσει λιγο την κατανάλωση και να δωσει δυναμη στα cores και αξιοποιηση του controller μνημης.

 

Α!!! και να ειναι σε am3+  :-D

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Κοίταξε τα multicore chip δεν είναι άσχημα . Για να λέμε του στραβού το δίκιο είναι πολύ πολύ μπροστά από οτιδήποτε .... σε καθημερινή χρήση.

 

Μπορεί τα reviews να μην δείχνουν την υψηλή απόδοση σε μια εφαρμογή που δεν τους εκμεταλλεύεται αλλά μπες στο σύστημά σου και πες μου πόσες διεργασίες τρέχουν ταυτόχρονα και σε πόσα νήματα ....

 

Πες μου μετά αν τρώει το παραμικρό σκάλωμα το σύστημά σου ... ακόμα και βάζοντάς του βαριές εργασίες να τρέξει ...

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Κοίταξε τα multicore chip δεν είναι άσχημα . Για να λέμε του στραβού το δίκιο είναι πολύ πολύ μπροστά από οτιδήποτε .... σε καθημερινή χρήση.

 

Μπορεί τα reviews να μην δείχνουν την υψηλή απόδοση σε μια εφαρμογή που δεν τους εκμεταλλεύεται αλλά μπες στο σύστημά σου και πες μου πόσες διεργασίες τρέχουν ταυτόχρονα και σε πόσα νήματα ....

 

Πες μου μετά αν τρώει το παραμικρό σκάλωμα το σύστημά σου ... ακόμα και βάζοντάς του βαριές εργασίες να τρέξει ...

 

προσωπικά δεν εχω κανένα παράπονο απ τον 8350. ιδικα στην μετατροπή βίντεο, εκει δίνει ρεστα, γενικα οτι και να κανω δεν νιωθει, ειναι σκυλι μαυρο !!!   

αλλα οταν βλεπω την ιντελ στα 22nm με 77watt tdp λεω οτι ειμαι λιγο πισω......

και σκέφτομαι πχ εναν fx στα 22nm με ποιο μεγλαη δυναμη στα cores ο οποιος να μπορει να ξεζουμισει ανετα τον controller μνημης και οι διαφορες απο ddr3 1600 σε 2400 να ειναι μεγαλες και εσθητες σε ολους τους τομεις !!!! τωρα στους fx που εχουμε η 1600αρες μνημες εχουμε η 2000+ δεν λεει να κανει σα μπροστα. και ας ειναι ο controler στα 1866. 

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Την AMD δεν την βοηθά τίποτα αυτή την εποχή. 

 

Είναι πίσω σε λιθογραφία 

Είναι πίσω σε single thread performance 

Και οι multithread εφαρμογές ψάχνονται ακόμα με το κιάλι ...

Τίποτα από αυτά δεν έχει σημασία .

Επειδή οι επεξεργαστές είναι αρκετά δυνατοί για οτιδήποτε σχεδόν. Όλοι (εκτός από μερικούς Atom βέβαια). 

Δούλεψα και σε bobcat (C-60 και E1-1200) και σε μικρούς Pentium, ακόμα και σε αρχαίους Athlon (όχι 64)  και Pentium 4 με Windows 7. 

Όλοι ήταν "good enough" όπως θα έλεγε και η Intel  :-D

Αυτός είναι και ο μεγαλύτερος εχθρός της Intel και της AMD. Οι επεξεργαστές τους είναι επαρκείς για το 90% των χρηστών εδώ και χρόνια.

Θα βοηθούσε την AMD το καλύτερο marketing παρά η βελτίωση των επεξεργαστών της.

Θα το φανταζόντουσαν άραγε ότι δεν θα αλλάξω επεξεργαστή επειδή δεν μου φτάνει η ισχύς του, αλλά επειδή δεν μπορώ να αναβαθμίσω το σύστημά μου λόγω του ότι ακρίβυνε υπερβολικά η DDR2;

  • Like 2
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

index.php?ct=news&action=file&id=2919

 

index.php?ct=news&action=file&id=2918

 

 

AMD joins The Document Foundation Advisory Board to accelerate LibreOffice          
Filed under: Announcements, Foundation — Florian Effenberger @ 10:49

Berlin, July 3rd, 2013 – The Document Foundation (TDF) announces that AMD is now a member of its Advisory Board. AMD is a leading designer and integrator of pioneering technologies that are at the heart of the digital devices people use and experience daily, pushing the boundaries of what is possible.

“It is great to work on LibreOffice with The Document Foundation to expose the raw power of AMD GPUs and APUs, initially to spreadsheet users,” said Manju Hegde, corporate vice president, Heterogeneous Solutions at AMD. “Bringing the parallelism and performance of our technology to traditional, mainstream business software users will be a welcome innovation for heavy duty spreadsheet users, particularly when combined with the compute capabilities of the upcoming generation of AMD Heterogeneous System Architecture (HSA) based products.”

“It is exciting to work together with AMD and their ecosystem to take advantage of AMD’s cutting edge innovation right inside LibreOffice,” said Michael Meeks, SUSE Distinguished Engineer and TDF Board Member, “The growth in performance and parallelism available in the GPUs of today, and particularly with AMD’s revolutionary APUs of tomorrow, is something we’re eager to expose to LibreOffice users.”

HSA is an innovative computing architecture that enables CPU, GPU and other processors to work together in harmony on a single piece of silicon by seamlessly moving the right tasks to the best suited processing element. This makes it possible for larger, more complex applications to take advantage of the power that has traditionally been reserved for more focused tasks. While the biggest impact will be for AMD APU users, supporting benefits of the work will improve the LibreOffice core data structures enabling larger spreadsheets to calculate faster for all users. This is only the start of exposing the power of the HSA enabled APU to business users providing better analytics and decision making across the board from finance to science.

With the addition of AMD, the Advisory Board of The Document Foundation now has eleven members: AMD, Google, RedHat, SUSE, Intel, Lanedo, the King Abdulaziz City of Science and Technology (KACST), the Inter-Ministry Mutalisation for an Open Productivity Suite (MIMO), the Free Software Foundation (FSF), Software in the Public Interest, and Freies Office Deutschland e.V.

 

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Ελληνικό SUPER PI το οποίο είναι και multitask (βάζεις αριθμό πυρήνων) είναι το SYSTESTER στο οποίο οι AMD σκοτώνουν !

 

http://systester.sourceforge.net/

το έβαλα, το δοκίμασα και δεν κάνει τίποτα.

σταματάει το πρόγραμμα και τα cores μένουν κολλημένα στο 100%.

δεν δουλεύει η εφαρμογή.

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Πως δεν δουλεύει βρε

 

Κοίταξε !

 

1z48.png

 

oe0.png



Όπως βλέπεις με 8 T το πρόγραμμα έχει πτώση επιδόσεων !

 

Στους PHENOM δεν υπήρχε καμιά πτώση !



Τέλος από 1 έως 4 T θα δεις πως η απόδοση είναι πάνω κάτω η ίδια !
 Καμιά πτώση !

 

Αρα το CMT έχει πτώση απόδοσης λόγω ταΐσματος , κοινού front-end.
 

fpjf.png



EDIT :  RUN  θα πατάς όχι TEST και για PI  !!!

  • Like 2
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε

Πρέπει να είστε μέλος για να αφήσετε σχόλιο

Δημιουργία λογαριασμού

Εγγραφείτε με νέο λογαριασμό στην κοινότητα μας. Είναι πανεύκολο!

Δημιουργία νέου λογαριασμού

Σύνδεση

Έχετε ήδη λογαριασμό; Συνδεθείτε εδώ.

Συνδεθείτε τώρα

  • Δημιουργία νέου...