Προς το περιεχόμενο

Προτεινόμενες αναρτήσεις

Δημοσ.

Όλοι οι σύγχρονοι επεξεργαστές έχουν hardware counters για τέτοια πράματα (cache hits/misses, TLB misses, FL operations κλπ). Μπορείς να τους διαβάσεις 1) με assembly 2) με κάποιο API όπως το perfcounter του Linux kernel 3) με higher level APIs όπως το PAPI (http://icl.cs.utk.edu/papi/) 4) με tools όπως το vampir, TAU κ.ά και τέλος 5) με κάποιο IDE που τα υποστηρίζει natively (βλ. Visual Studio).

 

Superlinear speedup βλέπεις ούτως η άλλως σε strong scaling, το οποίο, δεδομένου του μεγέθους των σύχρονων supercomputers, πεθαίνει (δε μπορείς να κάνεις strong scaling από 1 σε 100Κ πυρήνες, το πρόβλημά σου δεν "χωράει" στον 1). Αντ'αυτού, είτε κάνεις weak scaling είτε strong με σκαλοπάτια (δλδ από 1-128 τόσο μέγεθος, από 128-1024 με άλλο μέγεθος κλπ). Ένα πρόβλημα με 250Μ doubles πχ είναι πλέον μεσαίο προς μικρό.

Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε

Πρέπει να είστε μέλος για να αφήσετε σχόλιο

Δημιουργία λογαριασμού

Εγγραφείτε με νέο λογαριασμό στην κοινότητα μας. Είναι πανεύκολο!

Δημιουργία νέου λογαριασμού

Σύνδεση

Έχετε ήδη λογαριασμό; Συνδεθείτε εδώ.

Συνδεθείτε τώρα
  • Δημιουργία νέου...