FarCry Δημοσ. 17 Δεκεμβρίου 2008 Δημοσ. 17 Δεκεμβρίου 2008 Η επόμενη μεγάλη κίνηση στις CPU είναι το Fusion της AMD, που εάν αποδειχτεί πραγματικότητα και όχι αέρας κοπανιστός, θα φέρει την οριστική σύγκλιση της CPU με την GPU. Αν ολοκληρωθεί μέσα στο 2011, θα καταδειχτεί για άλλη μια φορά ότι η AMD σχεδιάζει την επόμενη αρχιτεκτονική της Intel. This approach makes much more sense in 32nm than in 45nm, simply as you will have enough space to put a good GPU and CPU on the same chip. The original Fusion, a 45nm CPU with GPU, has been canceled η intel πριν από μέρικς μέρες δήλωσε ότι ολοκλήρωσε το develpment στα 32nm.....ποιος είναι πρώτος? επίσης Integrated graphics processor (IGP) located off-die, but in the same CPU package http://en.wikipedia.org/wiki/Nehalem_(microarchitecture)
grimpr Δημοσ. 17 Δεκεμβρίου 2008 Δημοσ. 17 Δεκεμβρίου 2008 (επεξεργασμένο) Μάλλον δεν έπιασες το υπονοούμενο φίλε FarCry, άλλο CPU + ενα άθλιο IGP ως ενσωματωμένης κάρτας γραφικών για netbooks κτλπ, και άλλο Fusion CPU+GPU = APU ως μελλοντικός ανταγωνιστής των Cell στα Blade servers. Το μόνο που σώζει την Intel είναι το Larabee και εκεί θα δείξει... Επεξ/σία 17 Δεκεμβρίου 2008 από grimpr
FarCry Δημοσ. 17 Δεκεμβρίου 2008 Δημοσ. 17 Δεκεμβρίου 2008 καλά κάτσε πρώτα να ολοκληρώσει τα 32 και μετά βλέπουμε
grimpr Δημοσ. 17 Δεκεμβρίου 2008 Δημοσ. 17 Δεκεμβρίου 2008 TSMC Sketches 32 nm Rollout Plan for 2009 http://www.semiconductor.net/article/CA6555355.html Όπως βλέπεις, η Intel δεν είναι μόνη της.
FarCry Δημοσ. 17 Δεκεμβρίου 2008 Δημοσ. 17 Δεκεμβρίου 2008 TSMC Sketches 32 nm Rollout Plan for 2009 http://www.semiconductor.net/article/CA6555355.html Όπως βλέπεις, η Intel δεν είναι μόνη της. Last week, Intel Corp. rolled out its 32-nm process, based on a second-generation, high-k/metal-gate scheme http://www.eetindia.co.in/ART_8800556732_1800007_NT_2d73023c.HTM a small difference έχει ολοκληρώσει λέμε http://www.eetimes.com/news/semi/showArticle.jhtml?articleID=211600828 According to the IEDM paper, Intel built a functional 32-nm, 291-Mbit SRAM array test chip with a 0.171-micron2 cell size. The device has nearly 2 billion transistors, and an array density of 4.2-Mbit2. The test chip operated at 3.8-GHz at 1.1 Volt, according to the paper. Intel (Santa Clara, Calif.) is expected to deploy its first immersion lithography scanners at 32-nm. The 193-nm machines will be sourced from Nikon Corp. (Tokyo).
grimpr Δημοσ. 17 Δεκεμβρίου 2008 Δημοσ. 17 Δεκεμβρίου 2008 To ότι ολοκλήρωσε την διεργασία, δεν ενδιαφέρει καν όλη την υπόλοιπη βιομηχανία που στηρίζεται σε μεγάλα foundries όπως η TSMC για τα προϊόντα τους, προσωπικά θεωρώ πιο ενδιαφέρον τα νέα από TSMC παρά από Intel, μιας και η Nvidia και πολλοί άλλοι είναι πελάτες της TSMC.
FarCry Δημοσ. 17 Δεκεμβρίου 2008 Δημοσ. 17 Δεκεμβρίου 2008 η TMSC πρόσφατος μπήκε και στην αγορά τον cpu. μέχρι πρότινος είχε ασχολίες μονο με gpu. θα δούμε πως θα τα πάει. τεχνολογικά πάντως είναι πίσω από την intel. η intel έχει τα δικά τις fab. χέστηκε για την tmsc. πιο σημαντική είδηση είναι τις intel γιατί θα δούμε 32nm cpu το Q4 του 2009 και άσε τους άλλους να κουρεύονται http://www.intel.com/technology/architecture-silicon/32nm/index.htm
grimpr Δημοσ. 17 Δεκεμβρίου 2008 Δημοσ. 17 Δεκεμβρίου 2008 Ότι και να βγάλει η Intel παύει να έχει σημασία από την στιγμή που το ενδιαφέρον θα παίρνουνε όλο και περισσότερο οι GPUS, από δω και στο εξής μεγαλύτερη σημασία στην αγορά υπολογιστή θα έχει η μεγάλη διαρκεια ζωής πλατφόρμας (socket) και συνολικό power consumption και όχι η ποιο γρήγορη CPU.
dop Δημοσ. 17 Δεκεμβρίου 2008 Δημοσ. 17 Δεκεμβρίου 2008 Τι διαφοροποιεί ένα core της GPU της nVidia από ένα core Intel Atom; @grimpr: να είσαι ακριβής: το wall είναι το memory wall και αναφέρεται σε uniform access shared memory με cache coherence. Πρώτο βήμα είναι Non uniform access memory (NUMA) και ήδη γίνεται και το επόμενο είναι τελείως distributed (ήτοι cluster-like μηχανήματα με κάποιο ειδικό interconnect).
FarCry Δημοσ. 19 Δεκεμβρίου 2008 Δημοσ. 19 Δεκεμβρίου 2008 (επεξεργασμένο) όπως διαβάζω εδώ το memory wall είναι αναπόφευκτο. δε μπορείς να το αποτρέψεις. είναι θέμα φυσικής εξέλιξης Currently, CPU speed improvements have slowed significantly partly due to major physical barriers and partly because current CPU designs have already hit the memory wall in some sense. Intel summarized these causes in their Platform 2015 documentation (PDF http://en.wikipedia.org/wiki/Random_Access_Memory επίσης πάλι έχεις το πρόβλημα του latency λόγο τον interconnections. θες myrinet αλλα και πάλι αυτό είναι το slowest part του δικτύου http://en.wikipedia.org/wiki/Amdahl%27s_law http://en.wikipedia.org/wiki/Embarrassingly_parallel Επεξ/σία 19 Δεκεμβρίου 2008 από FarCry
pao13 Δημοσ. 19 Δεκεμβρίου 2008 Δημοσ. 19 Δεκεμβρίου 2008 και φυσικά το πρώτο λειτουργικό που θα κάνει χρήση όλα αυτά θα είναι πιο άλλο φυσικά από το osX 10.6 Snow Leopard http://www.guardian.co.uk/technology/2008/dec/18/apple-snow-leopard
dop Δημοσ. 19 Δεκεμβρίου 2008 Δημοσ. 19 Δεκεμβρίου 2008 Δεν το αποφεύγεις, το κρύβεις. Αυτό που κάνεις είναι να σπάσεις τα πάντα σε υποεργασίες και τις τρέχεις αυτές παράλληλα. Το κάθε ένα κομμάτι δουλειάς (task) από αυτά έχει κάποιες εξαρτήσεις από κάποια άλλα. Αυτά που μεταξύ τους δεν έχουν εξαρτήσεις, μπορείς να τα τρέξεις παράλληλα. Επιπλέον όμως μπορείς να τα τρέξεις και σε άλλο address space, αν κάνεις ένα αντίγραφο της μνήμης που χρειάζονται και το στείλεις. Αν είναι μεγάλα tasks (δηλαδή το computation θα πάρει περισσότερο χρόνο από την επικοινωνία) τότε μπορείς να τα στείλεις σε κάποιον επεξεργαστή μέσω κάποιου interconnect (βλ. Myrinet, Infiniband, Seastar, Ethernet κλπ). Αν είναι μικρά tasks τότε δεν αξίζει και είναι καλύτερο να τα τρέξεις σε κάποιο άλλο από τα διαθέσιμα cores. Και αν τα tasks σου παλεύουν για την ίδια διεύθυνση μνήμης (true sharing) τότε αξίζει να τα τρέξεις μέσω των διαφορετικών υποστηριζόμενων threads στο core (SMT, Hyperthreading, όπως θέλει ο καθένας το λέει). Ουσιαστικά έχεις μια ιεραρχιά με αυξανόμενο latency και μειούμενο bandwidth: SMT (hardware threads μέσα στο core), multi core (πολλά cores σε ένα chip), multi socket (πολλά chips σε ένα board), cluster (πολλά boards). Μετά από αυτό πας σε grids. Το CUDA ουσιαστικά είναι μια λύση με πολλά chips που βασίζεται στο PCI Express interconnect. Το θέμα είναι ότι τα περισσότερα tasks για ΚΑΘΗΜΕΡΙΝΗ χρήση είναι εξαιρετικά μικρά. Αν αντί για CUDA είχαμε απλώς ένα OpenMP πρόγραμμα με αντίστοιχους x86 cores, θα είχαμε την ίδια ταχύτητα, αν όχι καλύτερη. Εξ ου και οι προηγούμενες αναφορές μου. ΥΓ. τουλάχιστον η nVidia έκανε κάτι καλό - έβαλε τον απλό κόσμο στο λούκι του massive parallelism Όλοι για αυτό μιλούν λες και ανακάλυψαν την Αμερική.
Προτεινόμενες αναρτήσεις
Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε
Πρέπει να είστε μέλος για να αφήσετε σχόλιο
Δημιουργία λογαριασμού
Εγγραφείτε με νέο λογαριασμό στην κοινότητα μας. Είναι πανεύκολο!
Δημιουργία νέου λογαριασμούΣύνδεση
Έχετε ήδη λογαριασμό; Συνδεθείτε εδώ.
Συνδεθείτε τώρα