Ο Αντιπρόεδρος Hardware του Artificial Intelligence Products Group της Intel, Carey Kloss, έδωσε στη δημοσιότητα στοιχεία για την πρόοδο που έχει σημειώσει τελευταία η Intel πάνω στον επεξεργαστή νευρωνικών δικτύων της.
Ποια είναι η δουλειά ενός επεξεργαστή του είδους; Για να εκπαιδευτεί μία μηχανή χρησιμοποιώντας νευρωνικά δίκτυα απαιτούνται γιγαντιαίες ποσότητες μνήμης και αριθμητικών λειτουργιών προκειμένου να έχουμε κάποιο χρήσιμο αποτέλεσμα στην έξοδο.
Οι μεγάλες δυνατότητες κλιμάκωσης, η κατανάλωση ενέργειας και η μέγιστη αξιοποίηση πόρων αποτελούν τους ακρογωνιαίους λίθους της αρχιτεκτονικής του Intel Nervana, ενός επεξεργαστή που δημιουργήθηκε για να επιταχύνει εφαρμογές Βαθιάς Εκμάθησης και Τεχνητής Νοημοσύνης. Με την Intel να επιθυμεί να μεγιστοποιήσει την εξοικονόμηση ενέργειας, έπρεπε να βρεθεί ένας τρόπος ώστε τα δεδομένα να μην μετακινούνται στο εσωτερικό του συστήματος εκτός και να ήταν απολύτως απαραίτητο.
Αυτό σημαίνει ότι η πλατφόρμα Intel Nervana κατασκευάστηκε για να διατηρεί δεδομένα τοπικά, στο εσωτερικό του. Τα διανυσματικά δεδομένα μπορούν να διαμοιράζονται μεταξύ αρθρωμάτων μνήμης, ώστε να είναι πάντα κοντύτερα όταν απαιτούνται.
Σε αυτό παίζει ρόλο και η χρήση 32GB μνήμης HBM2 με memory bandwidth που ξεπερνάει το 1ΤB/s να είναι διαθέσιμο μεταξύ του die και των εξωτερικών memory banks. Αν και αναμφισβήτητα πρόκειται για ένα εντυπωσιακό νούμερο, το memory bandwidth συνεχίζει να αποτελεί περιοριστικό παράγοντα για τις ροές εργασίας βαθιάς εκμάθησης.
Η Intel θα ήθελε να υπήρχε διαθέσιμο ακόμα περισσότερο bandwidth, ωστόσο δεν γινόταν να περιμένει τις τεχνολογίες μνήμης επόμενης γενιάς, και έτσι συμβιβάστηκε με ότι καλύτερο υπήρχε σήμερα, τον τύπο HBM2 (High Bandwidth Memory 2). Ακόμα όμως και ο καλύτερος σημερινός τύπος μνήμης λειτουργούσε περιοριστικά για τη πλατφόρμα Intel Nervana οπότε και έπρεπε να γίνει περισσότερο… δημιουργική λαμβάνοντας ορισμένα μέτρα: έτσι, ο επεξεργαστής Nervana ενσωματώνει τοπικά κάποια αρθρώματα μνήμης μεγέθους 2MB το καθένα (η συνολική ποσότητα μνήμης φτάνει τα 30MB) με την Intel να χρησιμοποιεί λογισμικό για να ελέγξει τη λειτουργία της on-die μνήμης, που φορτώνει δεδομένα από την εξωτερική μνήμη μία φορά, και στη συνέχεια τα διαμοιράζει στα τοπικά αρθρώματα μνήμης. Μειώνοντας τα reads από την εξωτερική μνήμη, και επομένως έχοντας μικρότερη εξάρτηση από την εξωτερική μνήμη βοηθάει να αποτραπεί ο κορεσμός του memory bandwidth, παρέχοντας στην Intel δυνατότητα pre-fetching του επόμενου σετ δεδομένων που απαιτούνται για τη λειτουργία του συστήματος.
Site: Tweaktown
ΣΧΟΛΙΑ (14)
Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε
Πρέπει να είστε μέλος για να αφήσετε σχόλιο
Δημιουργία λογαριασμού
Εγγραφείτε με νέο λογαριασμό στην κοινότητα μας. Είναι πανεύκολο!
Δημιουργία νέου λογαριασμούΣύνδεση
Έχετε ήδη λογαριασμό; Συνδεθείτε εδώ.
Συνδεθείτε τώραΔημοσίευση ως Επισκέπτης
· Αποσύνδεση