To νέο μεγάλο γλωσσικό μοντέλο, με 405 δισεκατομμύρια παραμέτρους, αποδίδει καλύτερα έναντι των ανταγωνιστικών προτάσεων στα μαθηματικά, τη δημιουργία κώδικα και τις πολυγλωσσικές εργασίες, όπως υποστηρίζει η Meta.

Η Meta ανακοίνωσε την Τρίτη την κυκλοφορία του Llama 3.1, της νέας έκδοσης του μεγάλου γλωσσικού μοντέλου της, με την εταιρία να υποστηρίζει ότι πλέον στέκεται ισάξια απέναντι στις προτάσεις της OpenAI και της Anthropic. Η Meta προχώρησε στην κίνηση αυτή μόλις τρεις μήνες μετά την κυκλοφορία του Llama 3, ενσωματώνοντάς το στo Meta AI, ένα chatobot που πλέον συνοδεύει το Facebook, το Μessenger, το Instagram και το WhatsApp, ενώ υποστηρίζει και τα έξυπνα γυαλιά που κατασκευάζει η εταιρία. Στο διάστημα που μεσολάβησε μεταξύ της κυκλοφορίας των δύο εκδόσεων OpenAI και Anthropic διέθεσαν ήδη νέες εκδόσεις των δικών τους μοντέλων τεχνητής νοημοσύνης, με την κούρσα για την επικράτηση στην αγορά να συνεχίζεται με αμείωτη ένταση.

Η Meta επισημαίνει ότι το νέο μοντέλο, το Llama 3.1 405B, είναι το πρώτο ελεύθερα διαθέσιμο μοντέλο τεχνητής νοημοσύνης που μπορεί να σταθεί επάξια απέναντι στις ανταγωνιστικές προτάσεις σε επίπεδο γενικών γνώσεων, μαθηματικών ικανοτήτων αλλά και μετάφρασης σε πολλαπλές γλώσσες. Το μοντέλο εκπαιδεύτηκε με τη βοήθεια άνω των 16.000 H100 GPU της NVIDIA, τα οποία τη δεδομένη στιγμή είναι τα ταχύτερα διαθέσιμα chip, με κόστος γύρω στα 25.000 έκαστο, ενώ, πάντοτε σύμφωνα με τους ισχυρισμούς της Meta, το Llama 3.1 αποδίδει καλύτερα έναντι των ανταγωνιστικών προτάσεων σε περισσότερα από 150 benchmarks.

Το "405Β" παραπέμπει στις 405 δισεκατομμύρια παραμέτρους που ενσωματώνει το μοντέλο, εκείνες τις μεταβλητές δηλαδή στις οποίες βασίζεται το Llama προκειμένου να εξάγει συμπεράσματα και να λαμβάνει αποφάσεις. Όσο υψηλότερος ο αριθμός των παραμέτρων ενός μοντέλου, τόσο ικανότερο θεωρείται. Το GPT-4 της OpenAI, λόγου χάρη, φέρεται να ενσωματώνει περίπου 1,5 τρισεκατομμύρια παραμέτρους, αν και η εταιρία δεν έχει προβεί σε κάποια επίσημη ανακοίνωση επ' αυτού.

Παράλληλα με την κυκλοφορία του Llama 3.1 η Meta διέθεσε και αναβαθμισμένες εκδόσεις των υφιστάμενων μοντέλων Llama, τα οποία ενσωματώνουν 70 δισεκατομμύρια και 8 δισεκατομμύρια παραμέτρους, υποστηρίζοντας ότι οι νέες εκδόσεις διαθέτουν ισχυρότερες ικανότητες εξαγωγής συμπερασμάτων, μεταξύ άλλων.

Οι developers μπορούν να κατεβάσουν το Llama 3.1 από την επίσημη ιστοσελίδα, ενώ οι απλοί χρήστες μπορούν να δοκιμάσουν τις δυνατότητές του μέσω του Meta AI στο WhatsApp ή στο meta.ai, την ιστοσελίδα που έχει δημιουργήσει η εταιρία για το chatbot της. Επί του παρόντος, το Meta AI στο Facebook, το Messenger και το Instagram εξακολουθούν να ενσωματώνουν την μικρότερη έκδοση του Llama 3.1 που βασίζεται σε 70 δισεκατομμύρια παραμέτρους.

Αντίθετα με εταιρίες όπως η OpenAI, η Google, η Microsoft και η Anthropic, που διατηρούν τα μοντέλα τους κλειστά, τα μοντέλα τεχνητής νοημοσύνης της Meta είναι ανοιχτού κώδικα, πράγμα που σημαίνει ότι ο καθένας μπορεί να τα τροποποιήσει και να τα χρησιμοποιήσει δωρεάν, χωρίς να κοινοποιήσει προσωπικά δεδομένα στη Meta. Σε επιστολή του που δόθηκε στη δημοσιότητα την Τρίτη, ο Μαρκ Ζάκερμπεργκ, διευθύνων σύμβουλος της Meta, υποστηρίζει ότι μια προσέγγιση ανοιχτού κώδικα στην ανάπτυξη της τεχνητής νοημοσύνης θα διασφαλίσει ευρύτερη πρόσβαση στα οφέλη της τεχνολογίας αυτής, θα αποτρέπει τον έλεγχό της από λιγοστούς τεχνολογικούς κολοσσούς και θα διευκολύνει την ασφαλέστερη αξιοποίηση της τεχνητής νοημοσύνης στο σύνολο της κοινωνίας. Στόχος της Meta είναι να καταστεί το Llama "πρότυπο" για όσους επιθυμούν να αναπτύξουν εφαρμογές και υπηρεσίες τεχνητής νοημοσύνης, επισημαίνει ο Ζάκερμπεργκ στην επιστολή του.

  • Like 2
  • Haha 2