H Meta επανέρχεται δυναμικά στα μοντέλα τεχνητής νοημοσύνης με το Llama 3.1

Αλέξης Σολωμός 24/07/2024 06:10 μμ

To νέο μεγάλο γλωσσικό μοντέλο, με 405 δισεκατομμύρια παραμέτρους, αποδίδει καλύτερα έναντι των ανταγωνιστικών προτάσεων στα μαθηματικά, τη δημιουργία κώδικα και τις πολυγλωσσικές εργασίες, όπως υποστηρίζει η Meta.

Η Meta ανακοίνωσε την Τρίτη την κυκλοφορία του Llama 3.1, της νέας έκδοσης του μεγάλου γλωσσικού μοντέλου της, με την εταιρία να υποστηρίζει ότι πλέον στέκεται ισάξια απέναντι στις προτάσεις της OpenAI και της Anthropic. Η Meta προχώρησε στην κίνηση αυτή μόλις τρεις μήνες μετά την κυκλοφορία του Llama 3, ενσωματώνοντάς το στo Meta AI, ένα chatobot που πλέον συνοδεύει το Facebook, το Μessenger, το Instagram και το WhatsApp, ενώ υποστηρίζει και τα έξυπνα γυαλιά που κατασκευάζει η εταιρία. Στο διάστημα που μεσολάβησε μεταξύ της κυκλοφορίας των δύο εκδόσεων OpenAI και Anthropic διέθεσαν ήδη νέες εκδόσεις των δικών τους μοντέλων τεχνητής νοημοσύνης, με την κούρσα για την επικράτηση στην αγορά να συνεχίζεται με αμείωτη ένταση.

Η Meta επισημαίνει ότι το νέο μοντέλο, το Llama 3.1 405B, είναι το πρώτο ελεύθερα διαθέσιμο μοντέλο τεχνητής νοημοσύνης που μπορεί να σταθεί επάξια απέναντι στις ανταγωνιστικές προτάσεις σε επίπεδο γενικών γνώσεων, μαθηματικών ικανοτήτων αλλά και μετάφρασης σε πολλαπλές γλώσσες. Το μοντέλο εκπαιδεύτηκε με τη βοήθεια άνω των 16.000 H100 GPU της NVIDIA, τα οποία τη δεδομένη στιγμή είναι τα ταχύτερα διαθέσιμα chip, με κόστος γύρω στα 25.000 έκαστο, ενώ, πάντοτε σύμφωνα με τους ισχυρισμούς της Meta, το Llama 3.1 αποδίδει καλύτερα έναντι των ανταγωνιστικών προτάσεων σε περισσότερα από 150 benchmarks.

Το "405Β" παραπέμπει στις 405 δισεκατομμύρια παραμέτρους που ενσωματώνει το μοντέλο, εκείνες τις μεταβλητές δηλαδή στις οποίες βασίζεται το Llama προκειμένου να εξάγει συμπεράσματα και να λαμβάνει αποφάσεις. Όσο υψηλότερος ο αριθμός των παραμέτρων ενός μοντέλου, τόσο ικανότερο θεωρείται. Το GPT-4 της OpenAI, λόγου χάρη, φέρεται να ενσωματώνει περίπου 1,5 τρισεκατομμύρια παραμέτρους, αν και η εταιρία δεν έχει προβεί σε κάποια επίσημη ανακοίνωση επ' αυτού.

Παράλληλα με την κυκλοφορία του Llama 3.1 η Meta διέθεσε και αναβαθμισμένες εκδόσεις των υφιστάμενων μοντέλων Llama, τα οποία ενσωματώνουν 70 δισεκατομμύρια και 8 δισεκατομμύρια παραμέτρους, υποστηρίζοντας ότι οι νέες εκδόσεις διαθέτουν ισχυρότερες ικανότητες εξαγωγής συμπερασμάτων, μεταξύ άλλων.

Οι developers μπορούν να κατεβάσουν το Llama 3.1 από την επίσημη ιστοσελίδα, ενώ οι απλοί χρήστες μπορούν να δοκιμάσουν τις δυνατότητές του μέσω του Meta AI στο WhatsApp ή στο meta.ai, την ιστοσελίδα που έχει δημιουργήσει η εταιρία για το chatbot της. Επί του παρόντος, το Meta AI στο Facebook, το Messenger και το Instagram εξακολουθούν να ενσωματώνουν την μικρότερη έκδοση του Llama 3.1 που βασίζεται σε 70 δισεκατομμύρια παραμέτρους.

Αντίθετα με εταιρίες όπως η OpenAI, η Google, η Microsoft και η Anthropic, που διατηρούν τα μοντέλα τους κλειστά, τα μοντέλα τεχνητής νοημοσύνης της Meta είναι ανοιχτού κώδικα, πράγμα που σημαίνει ότι ο καθένας μπορεί να τα τροποποιήσει και να τα χρησιμοποιήσει δωρεάν, χωρίς να κοινοποιήσει προσωπικά δεδομένα στη Meta. Σε επιστολή του που δόθηκε στη δημοσιότητα την Τρίτη, ο Μαρκ Ζάκερμπεργκ, διευθύνων σύμβουλος της Meta, υποστηρίζει ότι μια προσέγγιση ανοιχτού κώδικα στην ανάπτυξη της τεχνητής νοημοσύνης θα διασφαλίσει ευρύτερη πρόσβαση στα οφέλη της τεχνολογίας αυτής, θα αποτρέπει τον έλεγχό της από λιγοστούς τεχνολογικούς κολοσσούς και θα διευκολύνει την ασφαλέστερη αξιοποίηση της τεχνητής νοημοσύνης στο σύνολο της κοινωνίας. Στόχος της Meta είναι να καταστεί το Llama "πρότυπο" για όσους επιθυμούν να αναπτύξουν εφαρμογές και υπηρεσίες τεχνητής νοημοσύνης, επισημαίνει ο Ζάκερμπεργκ στην επιστολή του.

ΣΧΟΛΙΑ (21)

Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε

Πρέπει να είστε μέλος για να αφήσετε σχόλιο

Δημιουργία λογαριασμού

Εγγραφείτε με νέο λογαριασμό στην κοινότητα μας. Είναι πανεύκολο!

Δημιουργία νέου λογαριασμού

Σύνδεση

Έχετε ήδη λογαριασμό; Συνδεθείτε εδώ.

Συνδεθείτε τώρα

Δημοσίευση ως Επισκέπτης

· Αποσύνδεση

Ne0n

Δημοσ. 30 Ιουλίου

- Share

Στις 27/7/2024 στις 3:02 ΜΜ, adastra είπε

Πολύ ενθαρρυντικό ότι η META κρατάει τέτοιο πανάκριβο μοντέλο open source.

Πιστεύω ότι ακολουθεί την συνταγή Bill Gates , το αφήνει ελεύθερο ώστε να κερδίσει αργότερα από το πολύτιμο feedback των μετα-δεδομένων που θα παραχθούν από όσους το χρησιμοποιήσουν (και ίσως βελτιώσουν)

Συνδέστε για να σχολιάσετε

https://www.insomnia.gr/forums/topic/830975-h-meta-%CE%B5%CF%80%CE%B1%CE%BD%CE%AD%CF%81%CF%87%CE%B5%CF%84%CE%B1%CE%B9-%CE%B4%CF%85%CE%BD%CE%B1%CE%BC%CE%B9%CE%BA%CE%AC-%CF%83%CF%84%CE%B1-%CE%BC%CE%BF%CE%BD%CF%84%CE%AD%CE%BB%CE%B1-%CF%84%CE%B5%CF%87%CE%BD%CE%B7%CF%84%CE%AE%CF%82-%CE%BD%CE%BF%CE%B7%CE%BC%CE%BF%CF%83%CF%8D%CE%BD%CE%B7%CF%82-%CE%BC%CE%B5-%CF%84%CE%BF-llama-31/#findComment-60372718

Κοινοποίηση σε άλλες σελίδες

adastra

Δημοσ. 30 Ιουλίου

- Share

Δεν βλέπω πως θα ωφεληθεί από τα μετα-δεδομένα κρατώντας το open source. Όσοι το χρησιμοποιήσουν εννοείς οι μεγάλοι οργανισμοί που έχουν την δυνατότητα να το τρέξουν;

Συνδέστε για να σχολιάσετε

Κοινοποίηση σε άλλες σελίδες

Ne0n

Δημοσ. 31 Ιουλίου

- Share

9 ώρες πριν, adastra είπε

Δεν βλέπω πως θα ωφεληθεί από τα μετα-δεδομένα κρατώντας το open source. Όσοι το χρησιμοποιήσουν εννοείς οι μεγάλοι οργανισμοί που έχουν την δυνατότητα να το τρέξουν;

Ένα opensource AI μπορεί να εγκατασταθεί και να χρησιμοποιηθεί από οποιονδήποτε ενδιαφέρεται, γιατί δεν είναι μόνο οι μεγάλοι οργανισμοί αλλά και εταιρίες ή χομπίστες του χώρου. (όπως για παράδειγμα το Linux που είναι επίσης opensource). Στην συνέχεια με την χρήση και τις δοκιμές που θα κάνουν οι διάφοροι ανεξάρτητοι developers θα παράγουν διάφορες μετατροπές και εξελίξεις του ,τις οποίες φυσικά θα τις κοινοποιούν και θα τις μοιράζονται στην αντίστοιχη κοινότητα που θα δημιουργηθεί.

Αυτό μειώνει φυσικά κατά πολύ το κόστος του developing για την μαμά εταιρία και ταυτόχρονα συμβάλει στην ταχύτερη διάδοση και εξέλιξη του.

Επεξ/σία 31 Ιουλίου από Ne0n

Συνδέστε για να σχολιάσετε

Κοινοποίηση σε άλλες σελίδες

adastra

Δημοσ. 31 Ιουλίου

- Share

Ρεαλιστικά όμως χρειάζεσαι τεράστιους πόρους για να το τρέξεις. π.χ. από εδώ

- **RAM**: 800GB to 1TB of system memory

- Multiple high-end GPUs (think NVIDIA A100 or H100)

- Cumulative VRAM in the hundreds of gigabytes

- A high-core-count server CPU

- High-speed SSDs are a must

- NVMe drives in RAID configuration for optimal performance

- Multiple high-wattage PSUs

- Possibly even a dedicated power circuit in your building

It’s crucial to understand that running such a large model locally is not typical or practical for most users or even organizations. This level of hardware is usually found in:

- Specialized AI research labs
- High-performance computing centers
- Cloud computing providers

Επεξ/σία 31 Ιουλίου από adastra

Συνδέστε για να σχολιάσετε

Κοινοποίηση σε άλλες σελίδες

Ne0n

Δημοσ. 1 Αυγούστου

- Share

16 ώρες πριν, adastra είπε

Ρεαλιστικά όμως χρειάζεσαι τεράστιους πόρους για να το τρέξεις. π.χ. από εδώ

- **RAM**: 800GB to 1TB of system memory

- Multiple high-end GPUs (think NVIDIA A100 or H100)

- Cumulative VRAM in the hundreds of gigabytes

- A high-core-count server CPU

- High-speed SSDs are a must

- NVMe drives in RAID configuration for optimal performance

- Multiple high-wattage PSUs

- Possibly even a dedicated power circuit in your building

It’s crucial to understand that running such a large model locally is not typical or practical for most users or even organizations. This level of hardware is usually found in:

- Specialized AI research labs
- High-performance computing centers
- Cloud computing providers

Όντως, προσωπικά έχω πάνω σε ένα σύστημα (GPU Server) 8(x) V100 και δεν φτάνουν ώστε να έχω το επιθυμητό 32GB(x)20 = 640GB ram στις GPU'S ώστε να τρέξω το 405 τοπικά. Συνολικά οι κάρτες μου έχουν 256GB ram και δεν μπορούν να το σηκώσουν σύμφωνα με τις προδιαγραφές που ζητάει. Αναγκαστικά θα πάω σε cluster που θα τρέχει την υφιστάμενη υποδομή μου σε συνδυασμό με νέα προσθήκη.

Σήμερα παράγγειλα περισσότερες κάρτες και έναν ακόμα νεότερο GPU Server ώστε να φτάσω στις ιδανικές απαιτήσεις για το 405 και βλέπουμε. Το 1TB System ram όμως το διαθέτω ήδη χάρη στον GPU Server που έχω εδώ και μερικά χρόνια τον οποίο τον είχα εξοπλίσει με αρκετή ram αρχικά όταν ξεκινούσα τα πειράματα μου στο machine learning.

Το να σηκώσεις και να συντηρήσεις το 405 το οποίο είναι η τελευταία και ultimate έκδοση του LIama ( υπάρχουν και οι μικρότερες προηγούμενες εκδόσεις του που έχουν αρκετά χαμηλότερες απαιτήσεις ) σε δική σου υποδομή τοπικά σίγουρα είναι πολύ ακριβή επένδυση όχι όμως απαγορευτική για οργανισμούς και μικρές εταιρίες που ασχολούνται με τον τομέα του ΑΙ , όπως αναφέρει το άρθρο. Κάλλιστα μπορείς να δοκιμάσεις τις προηγούμενες εκδόσεις του που είναι αρκετά ελαφρότερες και δεν είναι τόσο ακριβές σε απαιτήσεις. Υπάρχει και η λύση του cloud.vast για τις μικρές εταιρείες η οργανισμούς όπου μπορείς να νοικιάσεις έναν ιδανικό server ώστε να σηκώσεις τις προηγούμενες εκδόσεις του (το 405 είναι απαγορευτικό για χομπίστες όχι όμως οι αρχικές εκδόσεις του LIama) και να κάνεις τα πειράματα σου εκεί σε λογικό κόστος, ανάλογα με το τί θέλεις να κάνεις φυσικά: https://cloud.vast.ai/?ref_id=126744&template_id=fd2e982e4facaf7b2918006939d1e06e

Υπάρχει και η συμβατική δωρεάν λύση του Ollama (προσφέρει πολλά libraries , μοντέλα και πόρους που έχει διαθέσιμα στην δική του υποδομή) και δεν απαιτεί μεγάλους πόρους σε τοπικό hardware για την χρήση των εκδόσεων του LIama πλην της 405 (στην έκδοση 3.1 70B που είναι σχετικά η πιο απαιτητική από τις προηγούμενες θα χρειαστεί πχ μια RTX 3090 και 64GB ram ενώ πχ στην έκδοση 3.1 8B αντίστοιχα μία 3070 και 8GB ram που είναι σαφώς φθηνότερη επιλογή) και είναι φυσικά ιδανική για τους χομπίστες : https://ollama.com

Επεξ/σία 1 Αυγούστου από Ne0n

Συνδέστε για να σχολιάσετε

Κοινοποίηση σε άλλες σελίδες

adastra

Δημοσ. 1 Αυγούστου

- Share

Κάποια στιγμή θα πέσουν και οι τιμές στο hardware και θα γίνουν αυτά τα μοντέλα ποιο προσιτά (ίσως το Dojo D1 της Tesla καταφέρει να προσφέρει φτηνά cloud services). Είναι πολύ σημαντικό κατά την γνώμη μου να εκδημοκρατιστεί η τεχνολογία αυτή, δεν μπορεί να μένει στα χέρια ελάχιστων ανθρώπων (σαν τον Altman και τον Brin)

Σύνδεση

H Meta επανέρχεται δυναμικά στα μοντέλα τεχνητής νοημοσύνης με το Llama 3.1

Trending

ΣΧΟΛΙΑ (21)

Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε

Δημιουργία λογαριασμού

Σύνδεση

Συνδέστε για να σχολιάσετε

Κοινοποίηση σε άλλες σελίδες

Συνδέστε για να σχολιάσετε

Κοινοποίηση σε άλλες σελίδες

Συνδέστε για να σχολιάσετε

Κοινοποίηση σε άλλες σελίδες

Συνδέστε για να σχολιάσετε

Κοινοποίηση σε άλλες σελίδες

Συνδέστε για να σχολιάσετε

Κοινοποίηση σε άλλες σελίδες

Συνδέστε για να σχολιάσετε

Κοινοποίηση σε άλλες σελίδες

Σύνδεση