Προς το περιεχόμενο

Intel Comet Lake-S [2020]


Psycho_Warhead

Προτεινόμενες αναρτήσεις

3 ώρες πριν, CometRyzen είπε

Η στρεβή κατανόηση του amdahl's law έχει κλείσει πολλά σπίτια με i5 kabylake :P 

Του το εξηγείς, δεν καταλαβαίνει. Ρε pirmen, ρε χρυσό μου αγόρι, δεν δουλεύει έτσι όπως το έχεις καταλάβει. Στο εξήγησα και πρίν. Ο νόμος του amdahl σου λέει οτι δεν μπορείς να μειώσεις τον χρόνο εκτέλεσης μια εργασίας κάτω από τον χρόνο εκτέλεσης που θα χρειαστεί να εκτελεστεί το μονονηματικό κομμάτι της εργασίας, όσα threads και να προσθέσεις Όλα καλά έως εδώ. Αυτό που δεν καταλαβαίνεις είναι όμως οτι μπορεί να συμβεί το ΑΝΤΙΣΤΡΟΦΟ. Δηλαδή να αυξήσεις τον χρόνο εκτέλεσης μιας εργασίας επειδή δεν έχεις αρκετά threads ώστε να τελειώσεις και το πολυνηματικό κομμάτι της εργασίας εξίσου γρήγορα με το μονονηματικό. 

Το ίδιο πράγμα λες με άλλα λόγια. Όσο αυξάνεις τα cores/threads πλησιάζεις τον χρόνο εκτέλεσης της μονονηματικής εργασίας για τις παράλληλες εργασίες.

Γι αυτό και δεν κερδίζεις γραμμικά. Στον πρώτο διπλασιασμό threads κερδίζεις 85% π.χ., στον δεύτερο 50%, στον τρίτο 20% κτλ. μέχρι που φτάνεις ένα σημείο όπου 10.000.000 threads θα έχουν το ίδιο αποτέλεσμα με 64 π.χ.

Το ζητούμενο είναι αν πρόκειται να δούμε σύντομα game με μονονηματικό ΜΑΞ το 25% του κώδικα. Τότε ναι. Θα πάρουμε αξιόλογο κέρδος από cpu μέχρι και 16/32 που δεν θα βγαίνει τόσο εύκολα από arch improvement.  Το αν μπορεί να υπάρξει τέτοιο game είναι άλλη ιστορία και δεν έχει να κάνει μόνο με το rendering pipeline αλλά και με την αρκετά σειραϊκή game logic(που δεν είναι αποκλειστικά το AI).

spacer.png

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

  • Απαντ. 1,9k
  • Δημ.
  • Τελ. απάντηση

Συχνή συμμετοχή στο θέμα

Συχνή συμμετοχή στο θέμα

Δημοσιευμένες Εικόνες

5 λεπτά πριν, pirmen56 είπε

Το ίδιο πράγμα λες με άλλα λόγια. Όσο αυξάνεις τα cores/threads πλησιάζεις τον χρόνο εκτέλεσης της μονονηματικής εργασίας για τις παράλληλες εργασίες.

Γι αυτό και δεν κερδίζεις γραμμικά. Στον πρώτο διπλασιασμό threads κερδίζεις 85% π.χ., στον δεύτερο 50%, στον τρίτο 20% κτλ. μέχρι που φτάνεις ένα σημείο όπου 10.000.000 threads θα έχουν το ίδιο αποτέλεσμα με 64 π.χ.

Το ζητούμενο είναι αν πρόκειται να δούμε σύντομα game με μονονηματικό ΜΑΞ το 25% του κώδικα. Τότε ναι. Θα πάρουμε αξιόλογο κέρδος από cpu μέχρι και 16/32 που δεν θα βγαίνει τόσο εύκολα από arch improvement.  Το αν μπορεί να υπάρξει τέτοιο game είναι άλλη ιστορία και δεν έχει να κάνει μόνο με το rendering pipeline αλλά και με την αρκετά σειραϊκή game logic(που δεν είναι αποκλειστικά το AI).

spacer.png

Πάλι δεν το έχεις καταλάβει πλήρως. Το διάγραμμα είναι άσχετο. Να στο εξηγήσω ακόμα πιο απλά. Αν το μονονηματικό task μπορείς να το τρέξεις με 100 fps, τότε 100 είναιτο όριο σου, και όσους πυρήνες και να ρίξεις δεν θα έχεις κέρδος. Ως εδώ το έχεις πιάσει και συμφωνούμε. Όμως απλά και μόνο επειδή μπορείς να τρέξεις το μονονηματικό στα 100 fps δεν σημαίνει οτι θα βγάζεις και 100 fps. Αυτό είναι το κομμάτι που μάλλον δεν έχεις καταλάβει. Για να τα πιάσεις αυτά τα 100fps θα πρέπει και το πολυνηματικό μέρος να το τρέχεις στα 100. Αν τρέχεις το πολυνηματικό στα 70, 70 είναι το όριο σου. Αυτή είναι η κατάσταση λίγο πολύ μεταξύ 1600  και 7600k. Ο 1ος τρέχει πιο γρήγορα τα parallel, ο άλλος τα single.

Τα ποσοστά που έχεις γράψει δεν ισχύουν. γιατί δεν σου μιλάω για αύξηση ταχύτητας αλλά για μη μείωση. Δεν σου λέω δηλαδή οτι θα ρίχνεις πυρήνες και θα παίρνεις frames, σου λέω οτι θα ρίχνεις πυρήνες και έτσι το πολυνηματικό μέρος της εκτέλεσης θα παραμένει χέρι χέρι με το μονονηματικό ωστέ να μην χάνεις frames. Το αν θα φτάσουν σε 5 χρόνια τα παιχνίδια να μπορούν να  τεζάρουν 16 threads δεν το γνωρίζω, αλλά δεν το θεωρώ και απίθανο. Από το black flag του 13 που τέντως 1.5 πυρήνα πήγαμε το 2014 στο unity που τέντωνε 6 και μετά στο ACO που τεντώνει 12. 

Είναι πολύ εύκολο να φτιάξεις ενα πρόγραμμα που δείχνει αυτό που σου  λέω. Πάρε το cinebench για παράδειγμα και σπάσε την εικόνα σε 2 κομμάτια. Το 1% της εικόνας μπορεί να γίνει render μόνο από έναν πυρήνα, και το υπόλοιπο 99 από n πυρήνες. Το να ρίξεις 150 πυρήνες στο παραπάνω πρόβλημα δεν επιφέρει τίποτα. Στους 100 σταματάει να scalari, μιας και θα σε φρενάρι το μονονηματικό κομμάτι. Αλλά αν έχεις 50 πυρήνες τότε θα σε φρενάρουν αυτοι οι 50 πυρήνες. 

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Δημοσ. (επεξεργασμένο)

Δεν έχει νόημα να βασίζεσαι στον Amdahl's law όταν αναφέρεσαι σε μελλοντικό λογισμικό, αλλά στον πολύ πιο ρεαλιστικό Gustafson's law.

Χοντροκομμένο παράδειγμα με παιχνίδι:

Έχεις ένα παιχνίδι που απαιτεί για κάθε refresh 100ms CPU time, με το 80% να μπορεί να παραλληλιστεί. Άρα πράγματι το minimum που θα έχεις με άπειρους πυρήνες είναι 20 ms. Οπότε, αν το παράλληλο τμήμα κάνει scaling ομοιόρφα, με 16 πυρήνες θα χρειάζεσαι 20 + 80/16 = 25ms ενώ με 32 πυρήνες 20 + 80/32 = 22.5ms. Οπότε πράγματι, όσο και να αυξήσεις σε εκείνο το σημείο των αριθμό των πυρήνων δεν κερδίζεις κάτι αξιόλογο.

Βέβαια η πρώτη παρατήρηση είναι πως οι περισσότερες σημερινές consumer desktop CPUs δεν έχουν πάνω 8-16 πυρήνες (16-32 threads), οπότε δεν είμαστε στο σημείο να μιλάμε αν είναι καλύτερη μία CPU με 256 πυρήνες έναντι μίας με 1024 (που πράγματι δεν είναι).

Το πιο ρεαλιστικό σενάριο όμως, λέει πως όταν έχεις φτάσει να έχεις ένα συγκεκριμένο ρυθμό από refreshes (πχ. έχεις 200FPS), δεν έχει νόημα να προσπαθείς να το μειώσεις κι άλλο, αλλά μπορείς να κάνεις στον ίδιο χρόνο περισσότερα πράγματα. Άρα, το μόνο που χρειάζεσαι για να αξιοποιείς τους επιπλέον παράλληλους πόρους είναι το καινούργιο workload που θα εισάγεις να είναι παράλληλο. Και ίσα ίσα για τις επιπλέον βελτιώσεις που μπορούν να φέρουν τα παιχνίδια, υπάρχουν παράλληλες προσεγγίσεις για να υλοποιηθούν. Για παράδειγμα, και κανόνες φυσικής κωδικοποιείς σε ένα νευρωνικό δίκτυο, το οποίο από τη φύση του μπορεί να υπολογίζεται παράλληλα. Βέβαια, εκεί υπάρχει το ερώτημα μετά, αν με το ίδιο φυσικό αποτύπωμα στο τσιπάκι έχει νόημα να έχεις πχ. 32 τόσο πολύπλοκους πυρήνες μιας x86 CPU, ή 256 πυρήνες μιας απλούστερης ARM CPU, ή 4096 επεξεργαστικές μονάδες μιας GPU, καθώς η αύξηση της ταχύτητας κάθε μονάδας είναι λογαριθμική σε σχέση με τον αριθμό των transistor που απαιτούνται, ενώ η αύξηση του αριθμού των μονάδων είναι γραμμική σε σχέση πάλι με το φυσικό αποτύπωμα.

Πάντως υπάρχει ακόμη μέλλον για την αύξηση του αριθμού των πυρήνων στις CPUs.

Επεξ/σία από jimex
  • Like 7
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

24 λεπτά πριν, jimex είπε

Το πιο ρεαλιστικό σενάριο όμως, λέει πως όταν έχεις φτάσει να έχεις ένα συγκεκριμένο ρυθμό από refreshes (πχ. έχεις 200FPS), δεν έχει νόημα να προσπαθείς να το μειώσεις κι άλλο, αλλά μπορείς να κάνεις στον ίδιο χρόνο περισσότερα πράγματα. Άρα, το μόνο που χρειάζεσαι για να αξιοποιείς τους επιπλέον παράλληλους πόρους είναι το καινούργιο workload που θα εισάγεις να είναι παράλληλο. Και ίσα ίσα για τις επιπλέον βελτιώσεις που μπορούν να φέρουν τα παιχνίδια, υπάρχουν παράλληλες προσεγγίσεις για να υλοποιηθούν.

Someone who gets it επιτέλους. Το πρόβλημα των developers δεν είναι να ρίξουν τα frametimes κάτω από τα 33 ms, αυτό ακόμα και με τα jaguar το είχαν πετύχει σε κάποιες περιπτώσεις, και με τα zen2 θα είναι ο κανόνας τα 16ms πιστεύω. To πρόβλημα τους είναι να φτιάξουν όλο και πιο complex game logic, geometry, RT, physics, AI, netcode ακόμα και sound engine χωρίς να έχουν δραματικά χειρότερες επιδόσεις. Πιο πλούσια games θέλουν να φτιάξουν στις κονσόλες, όχι last gen με 144 fps. Στα open world games ειδικά αυτό φαίνεται από τη κατακόρυφη αύξηση σε cpu utilization τα τελευταία χρόνια πχ αν συγκρίνεις gta5 με RDR2 ή ACO.

  • Like 3
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Δημοσ. (επεξεργασμένο)
7 ώρες πριν, pirmen56 είπε

Το κακό ram latency και inter-core communication των ryzen λόγω infinity fabric πλήττει πάνω από όλα τα min fps και όχι τόσο τα max(και κατ' επέκταση το average). Όλα τα cpu ανεξαιρέτως κερδίζουν κυρίως σε min fps κάθε φορά που ρίχνεις το ram latency. Το είδα και στον δικό μου intel κάθε φορά που έριχνα timings.

Δυστυχώς, τα ~40ns που βγάζει το Χ intel με σύγχρονες ram και tuning δεν συγκρίνονται με τα 65-75ns των αντίστοιχων ryzen. Η διαφορά ξεπερνάει το 50%. Γι αυτό και βλέπεις συντριπτική διαφορά μεταξύ ryzen 3100 και ryzen 3300X ακόμα και στο crysis 3 που τα πάει όλα τα CPU τέρμα.

Το scaling, όσο υπάρχει κομμάτι του κώδικα που είναι μονονηματικό(δυστυχώς έτσι είναι), γίνεται ολοένα και χειρότερο. Amdahl's law.

Δηλαδή, από 4/8 σε 6/12 βλέπεις 35% διαφορά π.χ. Από 6/12 σε 8/16 20%. Από 8/16 σε 12/24 10% κοκ. Τυχαία νούμερα για να δείξω ότι δεν κερδίζεις πάντα αναλογικά.

Δεν μπορείς να πεις δηλαδή ότι ο 3900X έχει 50% threads παραπάνω από τον 9900K, άρα θα πάρω-κάποια στιγμή-50% αύξηση επιδόσεων και θα ξεπεράσω το +30% που έχει ο 9900K σε gaming STP. Θα είσαι ευτυχής αν πάρεις ένα 20% με τον 3900X πάνω από έναν ίδιο ryzen 8/16(3700X).

Κάνεις λαθος εδω.στα max υστερουν.Σε 1080p στο sotr που έχω ποσταρει σχετικα έχει καλύτερα lows στο cpu render ο 3900x από 9900k στα 5.2 μαλιστα .με b die σφιγμένες μνήμες και οι δυο

Επεξ/σία από billeiros
  • Like 2
  • Thanks 1
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

3 λεπτά πριν, billeiros είπε

Κάνεις λαθος εδω.στα max υστερουν.Σε 1080p στο sotr που έχω ποσταρει σχετικα έχει καλύτερα lows στο cpu render ο 3900x από 9900k στα 5 .με b die σφιγμένες μνήμες και οι δυο

'Ιδια κάρτα όμως? Γιατί αλλιώς η σύγκριση είναι άκυρη και το είχαν εξηγήσει παλαιότερα.

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Δημοσ. (επεξεργασμένο)
1 λεπτό πριν, ilos είπε

'Ιδια κάρτα όμως? Γιατί αλλιώς η σύγκριση είναι άκυρη και το είχαν εξηγήσει παλαιότερα.

Έχω συγκρίνει με 2080 ti.ναι

Asus oced και οι δύο.

 

Επεξ/σία από billeiros
  • Like 2
  • Thanks 1
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

1 λεπτό πριν, billeiros είπε

Έχω συγκρίνει με 2080 ti.ναι

Και εγώ έχω δει καλύτερα 1%lows με τον 3700x stock σε σχέση με 8600k oc 4.7 all core σε αρκετά games, αλλά αυτός είναι μισοπλέμονος δε μετράει.😁 Για τον 9900k μου κάνει εντύπωση.

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Δημοσ. (επεξεργασμένο)

Screenshot_2020-05-16-21-13-36-694_com.viber.voip.jpg

Screenshot_2020-05-16-21-16-04-884_com.miui.gallery.jpg

Το intel based σύστημα ειναι του τιτανοτεραστιου @azazil1190. Με  την καλύτερη 2080 ti εδώ μέσα κατά τη γνώμη μου από όσα έχω δει

 @azazil1190για να μιλάμε με αποδειξεις

Επεξ/σία από billeiros
  • Like 1
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

14 ώρες πριν, billeiros είπε

Screenshot_2020-05-16-21-13-36-694_com.viber.voip.jpg

Screenshot_2020-05-16-21-16-04-884_com.miui.gallery.jpg

Το intel based σύστημα ειναι του τιτανοτεραστιου @azazil1190. Με  την καλύτερη 2080 ti εδώ μέσα κατά τη γνώμη μου από όσα έχω δει

 @azazil1190για να μιλάμε με αποδειξεις

I call BS. Εισαι δάκτυλος της AMD και εσυ και ο @azazil1190 

Ετσι δεν ειναι @pirmen56 ?

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Και ο Amdhal Law αλλά και ο Gustafson Law δεν έχουν εφαρμογή σε προγράμματα όπως τα Παιχνίδια.

Ο πρώτος παίρνει σαν δεδομένο σταθερό φόρτο εργασίας (workload) και ο δεύτερος σταθερό χρόνο εκτέλεσης (Execution Time).

Στα παιχνίδια δεν έχουμε ποτέ δυο ίδια frames, άρα δεν έχουμε ποτέ ίδιο φόρτο εργασίας ανά frame αλλά ούτε σταθερό χρόνο εκτέλεσης ανά frame.  

Ο Amdhal Law μπορεί να χρησιμοποιηθεί για παράδειγμα σε επεξεργασία εικόνας όπου έχεις συγκεκριμένο Workload και ο Gustafson Law σε εφαρμογές Cloud όπου μπορεί να χρειάζεσαι  πολύ μεγάλους αριθμούς επεξεργαστών (Threads).

  • Like 2
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Δημοσ. (επεξεργασμένο)
20 ώρες πριν, jimex είπε

Το πιο ρεαλιστικό σενάριο όμως, λέει πως όταν έχεις φτάσει να έχεις ένα συγκεκριμένο ρυθμό από refreshes (πχ. έχεις 200FPS), δεν έχει νόημα να προσπαθείς να το μειώσεις κι άλλο, αλλά μπορείς να κάνεις στον ίδιο χρόνο περισσότερα πράγματα. Άρα, το μόνο που χρειάζεσαι για να αξιοποιείς τους επιπλέον παράλληλους πόρους είναι το καινούργιο workload που θα εισάγεις να είναι παράλληλο. Και ίσα ίσα για τις επιπλέον βελτιώσεις που μπορούν να φέρουν τα παιχνίδια, υπάρχουν παράλληλες προσεγγίσεις για να υλοποιηθούν. Για παράδειγμα, και κανόνες φυσικής κωδικοποιείς σε ένα νευρωνικό δίκτυο, το οποίο από τη φύση του μπορεί να υπολογίζεται παράλληλα. Βέβαια, εκεί υπάρχει το ερώτημα μετά, αν με το ίδιο φυσικό αποτύπωμα στο τσιπάκι έχει νόημα να έχεις πχ. 32 τόσο πολύπλοκους πυρήνες μιας x86 CPU, ή 256 πυρήνες μιας απλούστερης ARM CPU, ή 4096 επεξεργαστικές μονάδες μιας GPU, καθώς η αύξηση της ταχύτητας κάθε μονάδας είναι λογαριθμική σε σχέση με τον αριθμό των transistor που απαιτούνται, ενώ η αύξηση του αριθμού των μονάδων είναι γραμμική σε σχέση πάλι με το φυσικό αποτύπωμα.

Σωστός ο νόμος του Gustafson που λέει το εξής απλό. Αν προσθέτουμε παράλληλο κώδικα τότε το μονονηματικό κομμάτι θα συρρικώνεται ως ποσοστό του όλου κώδικα. Όμως το bold είναι η ουσία από όσα γράφεις και ο αγαπητός ilos(και φυσικά οι  υπολοιποί) έκαναν πως δεν είδαν.

Η Crytek κατόπιν παραγγελίας της AMD αποφάσισε να μετατρέψει τις CPU σε GPU και έριξε πάνω τους όλα τα physics του παιχνιδιου. Όπως ήταν αναμενόμενο οτιδήποτε κάτω από 4/8 σερνόταν κάτω από τα 50 καρέ και μόνο με 8/16 υπήρχε άνεση για πολλά καρέ. Μάντεψε πόσοι developers ακολούθησαν το παράδειγμα της Crytek στο Crysis 3. Κανένας. Γιατί όπως πολύ σοφά λες, υπάρχει ένας επεξεργαστής κατάλληλος για αφάνταστα παραλληλίσιμα tasks και λέγεται GPU.

Η CPU ιστορικά στόχευε στο να τρέχει καλά όλα τα tasks. Είναι γενικών καθηκόντων επεξεργαστής.

Δεν είναι τυχαίο ότι με τους Alder Lake η intel προσανατολίζεται σε ετερογενείς επεξεργαστές. Δηλαδή ένα die με μεγάλους πυρήνες και δυνατό IPC παράλληλα με ένα άλλο die μικρότερων και περισσότερων πυρήνων για παράλληλη επεξεργασία. Τα καραγκιοζιλίκια των περισσότερων ομοιογενών cores(γνωστό και ως "MOAR COARS") της AMD έχουν ημερομηνία λήξης ακόμα και για την ίδια. Το σωστό είναι διαφορετικά modules για διαφορετικές δουλειές.

 

19 ώρες πριν, billeiros είπε

Κάνεις λαθος εδω.στα max υστερουν.Σε 1080p στο sotr που έχω ποσταρει σχετικα έχει καλύτερα lows στο cpu render ο 3900x από 9900k στα 5.2 μαλιστα .με b die σφιγμένες μνήμες και οι δυο

Η σύγκριση ξεκίνησε από 9900K με 3700Χ/3800X με αποκλειστικό σκοπό να δούμε ποια εταιρεία έχει το καλύτερο STP για gaming.

Εσύ τώρα συγκρίνεις 3900X 12/24 με 9900K 8/16 σε dx12 render test(CPU render) που είναι ένα κομμάτι του κώδικα ΠΛΗΡΟΥΣ παιχνιδιού. Και πάλι ο 9900K στα 5% lows είναι κοντά.

Στο CPU game όμως που τρέχει τα πάντα(game logic, AI ,γραφικά κτλ.) ο 9900K είναι ασύγκριτα καλύτερος στα 5% lows, τα οποία δεν επηρεάζονται από αστάθμητους παράγοντες(π.χ. ένα μικρό freeze από τον σκληρό) όπως το min fps.

Επεξ/σία από pirmen56
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

3 λεπτά πριν, pirmen56 είπε

Σωστός ο νόμος του Gustafson που λέει το εξής απλό. Αν προσθέτουμε παράλληλο κώδικα τότε το μονονηματικό κομμάτι θα συρρικώνεται ως ποσοστό του όλου κώδικα. Όμως το bold είναι η ουσία από όσα γράφεις και ο αγαπητός ilos(και φυσικά οι  υπολοιποί) έκαναν πως δεν είδαν.

Η Crytek κατόπιν παραγγελίας της AMD αποφάσισε να μετατρέψει τις CPU σε GPU και έριξε πάνω τους όλα τα physics του παιχνιδιου. Όπως ήταν αναμενόμενο οτιδήποτε κάτω από 4/8 σερνόταν κάτω από τα 50 καρέ και μόνο με 8/16 υπήρχε άνεση για πολλά καρέ. Μάντεψε πόσοι developers ακολούθησαν το παράδειγμα της Crytek στο Crysis 3. Κανένας. Γιατί όπως πολύ σοφά λες, υπάρχει ένας επεξεργαστής κατάλληλος για αφάνταστα παραλληλίσιμα tasks και λέγεται GPU.

Η CPU ιστορικά στόχευε στο να τρέχει καλά όλα τα tasks. Είναι γενικής φύσεως επεξεργαστής.

Δεν είναι τυχαίο ότι με τους Alder Lake η intel προσανατολίζεται σε ετερογενείς επεξεργαστές. Δηλαδή ένα die με μεγάλους πυρήνες και δυνατό IPC παράλληλα με ένα άλλο die μικρότερων και περισσότερων πυρήνων για παράλληλη επεξεργασία. Τα καραγκιοζιλίκια των περισσότερων ομοιογενών cores(γνωστό και ως "MOAR COARS") της AMD έχουν ημερομηνία λήξης ακόμα και για την ίδια. Το σωστό είναι διαφορετικά modules για διαφορετικές δουλειές.

Η σύγκριση ξεκίνησε από 9900K με 3700Χ/3800X με αποκλειστικό σκοπό να δούμε ποια εταιρεία έχει το καλύτερο STP για gaming.

Εσύ τώρα συγκρίνεις 3900X 12/24 με 9900K 8/16 σε dx12 render test(CPU render) που είναι ένα κομμάτι του κώδικα ΠΛΗΡΟΥΣ παιχνιδιού. Και πάλι ο 9900K στα 5% lows είναι κοντά.

Στο CPU game όμως που τρέχει τα πάντα(game logic, AI ,γραφικά κτλ.) ο 9900K είναι ασύγκριτα καλύτερος στα 5% lows, τα οποία δεν επηρεάζονται από αστάθμητους παράγοντες(π.χ. ένα μικρό freeze από τον σκληρό) όπως το min fps.

Με λένε Ρίζο κι όπως θελω τα γυριζω

Επίσης σε όσα λες να παραθέτεις στοιχεία.οσα λες είναι αμφισβητισιμα

  • Like 1
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Δημοσ. (επεξεργασμένο)
19 ώρες πριν, ilos είπε

Someone who gets it επιτέλους. Το πρόβλημα των developers δεν είναι να ρίξουν τα frametimes κάτω από τα 33 ms, αυτό ακόμα και με τα jaguar το είχαν πετύχει σε κάποιες περιπτώσεις, και με τα zen2 θα είναι ο κανόνας τα 16ms πιστεύω. To πρόβλημα τους είναι να φτιάξουν όλο και πιο complex game logic, geometry, RT, physics, AI, netcode ακόμα και sound engine χωρίς να έχουν δραματικά χειρότερες επιδόσεις. Πιο πλούσια games θέλουν να φτιάξουν στις κονσόλες, όχι last gen με 144 fps. Στα open world games ειδικά αυτό φαίνεται από τη κατακόρυφη αύξηση σε cpu utilization τα τελευταία χρόνια πχ αν συγκρίνεις gta5 με RDR2 ή ACO.

Με τη λογική σου το CPU πρέπει να γίνει GPU και να αποκτήσει μερικές χιλιάδες ή και εκατομμύρια cores. Αφού με το νόμο του Gustafson μπορούμε συνέχεια να φορτώνουμε νέα πράγματα.

Αν είχαμε δηλαδή λίγα δυνατά cores για εργασίες που απαιτούν STP και ειδικούς συνεπεξεργαστές για AI, MIMD πράξεις, "you name it" θα ήταν αποτυχία σωστά;

Ξέρεις γιατί ο 7700K αφήνε πίσω στο HEVC encoding τον 1600X και πλησίαζε στοκ ryzen 1700 με τα διπλάσια threads; Λέγεται AVX2 256 bit. Συνεπεξεργαστής με μεγάλη παραλληλία για ειδική κατηγορία πινακοπράξεων. Δεν θέλει κόπο, θέλει τρόπο.

16 λεπτά πριν, billeiros είπε

Με λένε Ρίζο κι όπως θελω τα γυριζω

Επίσης σε όσα λες να παραθέτεις στοιχεία.οσα λες είναι αμφισβητισιμα

Στο Jimex αναφέρεσαι;

Να κάνεις σε αυτόν αναφορά καλύτερα και όχι σε μένα. Εγώ απλά παραθέτω πράγματα που ξεχάσατε να δείτε.

20 ώρες πριν, jimex είπε

Βέβαια, εκεί υπάρχει το ερώτημα μετά, αν με το ίδιο φυσικό αποτύπωμα στο τσιπάκι έχει νόημα να έχεις πχ. 32 τόσο πολύπλοκους πυρήνες μιας x86 CPU, ή 256 πυρήνες μιας απλούστερης ARM CPU, ή 4096 επεξεργαστικές μονάδες μιας GPU, καθώς η αύξηση της ταχύτητας κάθε μονάδας είναι λογαριθμική σε σχέση με τον αριθμό των transistor που απαιτούνται, ενώ η αύξηση του αριθμού των μονάδων είναι γραμμική σε σχέση πάλι με το φυσικό αποτύπωμα.

 

Επεξ/σία από pirmen56
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

11 λεπτά πριν, pirmen56 είπε

Με τη λογική σου το CPU πρέπει να γίνει GPU και να αποκτήσει μερικές χιλιάδες ή και εκατομμύρια cores. Αφού με το νόμο του Gustafson μπορούμε συνέχεια να φορτώνουμε νέα πράγματα.

Αν είχαμε δηλαδή λίγα δυνατά cores για εργασίες που απαιτούν STP και ειδικούς συνεπεξεργαστές για AI, MIMD πράξεις, "you name it" θα ήταν αποτυχία σωστά;

Ξέρεις γιατί ο 7700K αφήνε πίσω στο encoding τον 1600X και πλησίαζε στοκ ryzen 1700 με τα διπλάσια threads; Λέγεται AVX2 256 bit. Συνεπεξεργαστής με μεγάλη παραλληλία για ειδική κατηγορία πινακοπράξεων. Δεν θέλει κόπο, θέλει τρόπο.

Δεν είπα αυτό, και προφανώς και κάποιος κώδικας πρέπει να εκτελεστεί σειριακά, δε γίνεται αλλιώς. Το θέμα είναι ότι με τα low level apis σου δίνεται η δυνατότητα να κάνεις fork πολύ rendering workload και σε άλλα threads. Encoding εννοείς προφανώς h265 (που και πάλι 1-2% γρηγορότερος είναι ο 7700κ από επεξεργαστή χωρίς καν το σετάκι εντολών που κόστιζε τα μισά χρήματα)😁. Αν αυτό είναι win για σένα τι να πω. Βάλε και τα avx512 benches για τους zen2 που δεν υποστηρίζουν πάλι. Meanwhile:

index.php?ct=articles&action=file&id=314

  • Like 1
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Επισκέπτης
Αυτό το θέμα είναι πλέον κλειστό για περαιτέρω απαντήσεις.

  • Δημιουργία νέου...