Parallelization of code [Fortran Matlab]

stathi02 · 24 Οκτωβρίου 2010

Παιδιά καλημέρα, χρησιμοποιώ στη δουλειά μου Fortran και ολίγο Matlab. Έχω κάποια προγράμματα τα οποία είναι πολύ απαιτητικά (Global optimization) και θα ήθελα σιγά σιγά να τα κάνω να εκμεταλεύονται τα τελευταία PC (4 core). Χρησιμοποιώ Ιντελ compiler 10. Σε πρώτη φάση θα ήθελα μια γενική άποψη από κάποιον γνώστη. Ένα βιβλίο ή ebook για πρώτη φάση θα με ενδιέφερε (fortran & matlab).

Ευχαριστώ

stathi02 · 24 Οκτωβρίου 2010

Παιδιά καλημέρα, χρησιμοποιώ στη δουλειά μου Fortran και ολίγο Matlab. Έχω κάποια προγράμματα τα οποία είναι πολύ απαιτητικά (Global optimization) και θα ήθελα σιγά σιγά να τα κάνω να εκμεταλεύονται τα τελευταία PC (4 core). Χρησιμοποιώ Ιντελ compiler 10. Σε πρώτη φάση θα ήθελα μια γενική άποψη από κάποιον γνώστη. Ένα βιβλίο ή ebook για πρώτη φάση θα με ενδιέφερε (fortran & matlab).

Ευχαριστώ

V.I.Smirnov · 24 Οκτωβρίου 2010

Για matlab θα σου πουν άλλοι.

H Ιntel fortran όπως την έχεις μπορεί να κάνει τόσο αυτόματη παραλληλοποίηση όσο και με χρήση του openMP.

Μπορεί επίσης να συνδυαστούν αμφότερα.

Επίσης μπορεί επιπλέον να γίνει και vectorization.

H αποτελεσματικότητα όλων αυτών εξαρτάται ισχυρά από το στυλ γραφής.

Δεν ξέρω αν η intel fortran 10 υποστηρίζει το openMP 3 - πάντως η 11 το υποστηρίζει.

Μιλώντας για την έκδοση 11, το help που έχει είναι πολύ κατατοπιστικό, με παραδείγματα για το πώς μπορεί να χρησιμοποιηθεί.

Τutorial για το openMP υπάρχουν άφθονα, ένα καλό είναι εδώ :

https://computing.llnl.gov/tutorials/openMP/#Abstract

Βιβλία επίσης υπάρχουν - όχι πολλά αλλά αξίζουν. Αυτά που έχω διαβάσει εγώ είναι τα :

"Using OpenMP Portable Shared Memory Parallel Programming"

"Parallel Programming in OpenMP"

Μπορείς να τα βρεις και ηλεκτρονικά τσάμπα αν ψάξεις.

Εκ των ουκ ανευ είναι επίσης και το επίσημο site του openMP που περιγράφει το standard για fotran και C/C++

με παραδείγματα και λεπτομέρειες.

Eπίσης, ο μπλε τόμος από το κλασσικό Numerical Recipes περιέχει όλες τις ρουτίνες αυτής της βιβλιοθήκης

μετεγραμμένες στο εγγενές παράλληλο στυλ της fortran (ήδη από το '96). Στο πρώτο κεφάλαιο έχει και πολλές

χρήσιμες υποδείξεις. Αυτό είναι κατάλληλο για εφαρμογή της αυτόματης παραλληλοποίησης.

Από τα πιο χρήσιμα βιβλία εφαρμοσμένης αριθμητικής ανάλυσης.

To κακό με το OpenMP 3 είναι ότι μερικά χρήσιμα χαρακτηριστικά του δεν υποστηρίζονται ακόμη από τους compilers παρόλο που

τα ορίζει το πρότυπο. Π.χ. η εντολή workshare με την οποία οι πράξεις πινάκων όπως Α = Β + C (αλλά και όλες οι εντολές που δρουν

σε πίνακες) θα έπρεπε να γίνονται παράλληλα, δεν υλοποιείται πραγματικά και η πράξη εκτελείται σειριακά - τουλάχιστον στον

compiler της intel. Το ίδιο και οι εγγενείς εντολές της fortran forall και where : δεν τις παραλληλίζει ο compiler με το openMP.

Στις περιπτώσεις αυτές μπορεί να χρησιμοποιηθεί αυτόματος παραλληλισμός και vectorization.

Αν κοιτάξεις στο menu project->properties κλπ θα βρεις πώς ενεργοποιούνται και πώς δουλεύουν (καθώς επίσης και το help).

Ένα θέμα υπάρχει επίσης με την φωλιασμένη (nested) παραλληλία. Για όλα αυτά φταίνε βέβαια οι compilers και όχι το πρότυπο.

(Eν διαβάσει, επισημαίνεται ότι η workshare δεν ορίζεται για την C/C++ διότι εκεί δεν υποστηρίζονται εγγενώς πίνακες.)

Ξαναλέω πάντως ότι οι επιδόσεις του ΟpenΜP (αλλά και της αυτόματης παραλληλίας) εξαρτώνται ισχυρά από το στυλ γραφής

και οδηγίες επ' αυτού περιγράφονται στα βιβλία που πρότεινα πριν, ειδικά στο πρώτο.

Τα tutorial στο διαδίκτυο δεν λένε τίποτε άλλο παρά απλή περιγραφή των εντολών που ΔΕΝ αρκεί.

Άλλος τρόπος παραλληλοποίησης είναι με το MPI. Μπορεί να χρησιμοποιηθεί με την intel fortran, C++ καθώς και

μέσα από το visual studio αλλά μάλλον δεν θα σου κάνει (το γιατί θα το δεις αν ασχοληθείς λίγο μαζί του).

Αν επιμείνεις πάντως ξέρω να σου πω πώς θα ξεκινήσεις και μ' αυτό. Μάλιστα συνδυάζεται και με το OpenMP και

αυτός ο συνδυασμός είναι της μόδας τα τελευταία χρόνια.

Τα posix threads είναι μια εναλλακτική λύση (προσωπικά δεν τα έχω δοκιμάσει) αλλά μειονεκτούν στο ότι απαιτούν

χειρισμό πολλών λεπτομερειών και χαμηλό επίπεδο γραφής.

Τέλος υπάρχουν και βιβλιοθήκες όπως η ΤΒΒ της Intel που κάνουν παραλληλισμό με εύκολο τρόπο.

Τα posix threads και η TBB είναι για γενικότερο παραλληλισμό (κυρίως παραλληλισμό ελέγχου) κι' όχι τόσο για scientific programming.

Κλείνοντας, στο scientific programming ενδιαφέρει κυρίως ο παραλληλισμός δεδομένων (κι όχι ελέγχου) στον οποίο το openMP και

οι δυνατότητες αυτόματης παραλληλίας της fortran είναι πολύ καλά προσαρμοσμένες και εύχρηστες.

Στη fortran η καλύτερη επιλογή να ξεκινήσεις είναι μάλλον το openMP.

-

V.I.Smirnov · 24 Οκτωβρίου 2010