Αναζήτηση στην κοινότητα
Εμφάνιση αποτελεσμάτων για τις ετικέτες 'llama'.
4 αποτελέσματα
-
Ένα από τα κορυφαία μοντέλα μεγάλης γλωσσικής τεχνητής νοημοσύνης πέρασε το τεστ Turing, ένα μακροχρόνιο βαρόμετρο για την ανθρωπόμορφη νοημοσύνη. Σύμφωνα με νέα προδημοσιευμένη μελέτη που αναμένει αξιολόγηση από ομότιμους, ερευνητές αναφέρουν ότι σε μια τριμερή έκδοση του τεστ Turing, όπου οι συμμετέχοντες συνομιλούν ταυτόχρονα με έναν άνθρωπο και μια τεχνητή νοημοσύνη και στη συνέχεια αξιολογούν ποιος είναι ποιος, το μοντέλο GPT-4.5 της OpenAI θεωρήθηκε άνθρωπος στο 73% των περιπτώσεων όταν είχε οδηγίες να υιοθετήσει συγκεκριμένο χαρακτήρα. Το ποσοστό αυτό είναι σημαντικά υψηλότερο από την τυχαία πιθανότητα του 50%, υποδηλώνοντας ότι το τεστ Turing έχει ξεπεραστεί κατά πολύ. Η έρευνα αξιολόγησε επίσης το μοντέλο LLama 3.1-405B της Meta, το μοντέλο GPT-4o της OpenAI και ένα πρώιμο chatbot γνωστό ως ELIZA που αναπτύχθηκε αρκετά χρόνια πριν. "Οι άνθρωποι δεν ήταν καλύτεροι από την τύχη στο να διακρίνουν ανθρώπους από το GPT-4.5 και το LLaMa (με την προτροπή προσωπικότητας)", έγραψε ο επικεφαλής συγγραφέας Cameron Jones, ερευνητής στο Εργαστήριο Γλώσσας και Γνώσης του UC San Diego, σε ανάρτηση στο X σχετικά με την εργασία. "Και το GPT 4.5 κρίθηκε ως άνθρωπος σημαντικά συχνότερα από τους πραγματικούς ανθρώπους!" Το τεστ Turing οφείλει την ονομασία του στον Βρετανό μαθηματικό και επιστήμονα υπολογιστών Alan Turing. Το 1950, ο Turing πρότεινε μια μέθοδο για την αξιολόγηση της νοημοσύνης μιας μηχανής, η οποία περιλάμβανε συνομιλίες κειμένου μεταξύ ενός ανθρώπου-αξιολογητή και δύο συνομιλητών που βρίσκονταν εκτός οπτικού πεδίου: μιας μηχανής και ενός άλλου ανθρώπου. Ο ίδιος ο Turing αναφερόταν σε αυτή τη διαδικασία ως "παιχνίδι μίμησης". Στην πρόσφατη μελέτη, οι ερευνητές διεξήγαγαν το περίφημο πείραμα σε μια διαδικτυακή πλατφόρμα. Για οκτώ γύρους, ένα δείγμα σχεδόν 300 συμμετεχόντων τοποθετήθηκε τυχαία είτε ως ανακριτής είτε ως ένας από τους δύο "μάρτυρες" που ανακρίνονται, με τον άλλο "μάρτυρα" να είναι ένα chatbot. Ένα βασικό σημείο εδώ είναι πώς προγραμματίστηκαν τα μοντέλα AI. Ένας τύπος ήταν η προτροπή "χωρίς προσωπικότητα", όπου η AI έλαβε μόνο βασικές οδηγίες. Για την προτροπή "προσωπικότητας", από την άλλη πλευρά, η AI ενημερώθηκε συγκεκριμένα να υιοθετήσει συγκεκριμένο χαρακτήρα, όπως ένα νεαρό άτομο με γνώσεις για το διαδίκτυο και τον πολιτισμό. Οι οδηγίες αυτές έκαναν τεράστια διαφορά. Χωρίς προτροπή προσωπικότητας, το GPT-4.5 πέτυχε συνολικό ποσοστό επιτυχίας μόλις 36%, σημαντικά χαμηλότερο από το 73% που θριάμβευσε στο Turing. Ως βάση, το GPT-4o, που τροφοδοτεί την τρέχουσα έκδοση του ChatGPT και έλαβε μόνο προτροπές χωρίς προσωπικότητα, πέτυχε ένα ακόμη λιγότερο πειστικό 21%. (Κάπως, το αρχαίο ELIZA ξεπέρασε οριακά το κορυφαίο μοντέλο της OpenAI με ποσοστό επιτυχίας 23%.) Ωστόσο, όπως επισημαίνει ο Jones, τα αποτελέσματα δεν σημαίνουν απαραίτητα ότι τα LLMs είναι ευφυή όπως οι άνθρωποι. "Νομίζω ότι είναι μια πολύ περίπλοκη ερώτηση...", έγραψε ο Jones στο Twitter. "Αλλά γενικά πιστεύω ότι αυτό θα πρέπει να αξιολογηθεί ως ένα από τα πολλά πρόσθετα στοιχεία για το είδος της νοημοσύνης που εμφανίζουν τα LLMs." "Πιστεύω ότι τα αποτελέσματα παρέχουν περισσότερες αποδείξεις ότι τα LLMs θα μπορούσαν να υποκαταστήσουν τους ανθρώπους σε σύντομες αλληλεπιδράσεις χωρίς κανείς να μπορεί να το καταλάβει", πρόσθεσε. "Αυτό θα μπορούσε δυνητικά να οδηγήσει σε αυτοματοποίηση θέσεων εργασίας, βελτιωμένες επιθέσεις κοινωνικής μηχανικής και γενικότερη κοινωνική αναστάτωση." Ο Jones κλείνει τονίζοντας ότι το τεστ Turing δεν βάζει μόνο τις μηχανές κάτω από το μικροσκόπιο - αντικατοπτρίζει επίσης τις συνεχώς εξελισσόμενες αντιλήψεις των ανθρώπων για την τεχνολογία. Έτσι τα αποτελέσματα δεν είναι στατικά: ίσως καθώς το κοινό εξοικειώνεται περισσότερο με την αλληλεπίδραση με την τεχνητή νοημοσύνη, θα γίνει καλύτερο και στον εντοπισμό της. Διαβάστε ολόκληρο το άρθρο
-
Η Meta κυκλοφόρησε τα δύο πρώτα μοντέλα από τη σουίτα πολυτροπικών μοντέλων Llama 4: το Llama 4 Scout και το Llama 4 Maverick, ενώ ανακοίνωσε και το επερχόμενο Llama 4 Behemoth. Όπως αναφέρε στο blog της εταιρείας, το Maverick είναι "ο ακούραστης εργάτης" των δύο και διαπρέπει στην κατανόηση εικόνας και κειμένου για "γενικές περιπτώσεις χρήσης βοηθού και συνομιλίας", ενώ το μικρότερο μοντέλο Scout θα μπορούσε να αντιμετωπίσει θέματα όπως "συνοψίσεις πολλαπλών εγγράφων, ανάλυση εκτεταμένης δραστηριότητας χρήστη για εξατομικευμένες εργασίες και συλλογισμό σε τεράστιες βάσεις κώδικα". Η εταιρεία παρουσίασε επίσης το Llama 4 Behemoth, ένα επερχόμενο μοντέλο που, όπως αναφέρει, είναι "μεταξύ των εξυπνότερων LLM στον κόσμο". Ο Διευθύνων Σύμβουλος Mark Zuckerberg δήλωσε ότι θα ακούσουμε για ένα τέταρτο μοντέλο, το Llama 4 Reasoning, "τον επόμενο μήνα". Τόσο το Maverick όσο και το Scout είναι διαθέσιμα για λήψη από τον ιστότοπο του Llama και το Hugging Face, και έχουν προστεθεί στο Meta AI, συμπεριλαμβανομένων των εφαρμογών WhatsApp, Messenger και Instagram DMs. Σύμφωνα με τη Meta, το Scout διαθέτει 17 δισεκατομμύρια ενεργές παραμέτρους με 16 ειδικούς. Όπως ανέφερε ο Zuckerberg, "Είναι εξαιρετικά γρήγορο, εγγενώς πολυτροπικό και διαθέτει ένα κορυφαίο στον κλάδο, σχεδόν άπειρο μήκος πλαισίου 10 εκατομμυρίων tokens, και είναι σχεδιασμένο να λειτουργεί σε μία μόνο GPU". Το Maverick από την άλλη πλευρά έχει 17 δισεκατομμύρια ενεργές παραμέτρους με 128 ειδικούς. Η εταιρεία υποστηρίζει ότι ξεπερνά ανταγωνιστές όπως το GPT-4o και το Gemini 2.0 σε δοκιμές κώδικα, συλλογισμού, πολυγλωσσικότητας, μακρού πλαισίου και εικόνας, και είναι εφάμιλλο του DeepSeek v3.1 σε συλλογισμό και κωδικοποίηση. Ο Zuckerberg ήδη χαρακτηρίζει το επερχόμενο μοντέλο Behemoth, το οποίο βρίσκεται ακόμη σε φάση εκπαίδευσης, ως "το υψηλότερης απόδοσης βασικό μοντέλο στον κόσμο", με 288 δισεκατομμύρια ενεργές παραμέτρους, σύμφωνα με την εταιρεία. Αν και το Behemoth δεν είναι ακόμη διαθέσιμο, είναι πιθανό να ακούσουμε περισσότερα για αυτό και το μοντέλο Reasoning σύντομα. Το μεγάλο συνέδριο προγραμματιστών AI της Meta, το LlamaCon, είναι μόλις λίγες εβδομάδες μακριά, όπου αναμένεται να παρουσιαστούν περισσότερες λεπτομέρειες. Τα νέα μοντέλα της Meta αποτελούν σημαντική εξέλιξη στον τομέα της τεχνητής νοημοσύνης, καθώς προσφέρουν προηγμένες δυνατότητες επεξεργασίας εικόνας και κειμένου, ενώ παράλληλα είναι προσβάσιμα μέσω πολλαπλών πλατφορμών της εταιρείας, διευρύνοντας έτσι τις δυνατότητες χρήσης της τεχνολογίας AI σε καθημερινές εφαρμογές. Διαβάστε ολόκληρο το άρθρο
-
Σύμφωνα με νέα προδημοσιευμένη μελέτη που αναμένει αξιολόγηση από ομότιμους, ερευνητές αναφέρουν ότι σε μια τριμερή έκδοση του τεστ Turing, όπου οι συμμετέχοντες συνομιλούν ταυτόχρονα με έναν άνθρωπο και μια τεχνητή νοημοσύνη και στη συνέχεια αξιολογούν ποιος είναι ποιος, το μοντέλο GPT-4.5 της OpenAI θεωρήθηκε άνθρωπος στο 73% των περιπτώσεων όταν είχε οδηγίες να υιοθετήσει συγκεκριμένο χαρακτήρα. Το ποσοστό αυτό είναι σημαντικά υψηλότερο από την τυχαία πιθανότητα του 50%, υποδηλώνοντας ότι το τεστ Turing έχει ξεπεραστεί κατά πολύ. Η έρευνα αξιολόγησε επίσης το μοντέλο LLama 3.1-405B της Meta, το μοντέλο GPT-4o της OpenAI και ένα πρώιμο chatbot γνωστό ως ELIZA που αναπτύχθηκε αρκετά χρόνια πριν. "Οι άνθρωποι δεν ήταν καλύτεροι από την τύχη στο να διακρίνουν ανθρώπους από το GPT-4.5 και το LLaMa (με την προτροπή προσωπικότητας)", έγραψε ο επικεφαλής συγγραφέας Cameron Jones, ερευνητής στο Εργαστήριο Γλώσσας και Γνώσης του UC San Diego, σε ανάρτηση στο X σχετικά με την εργασία. "Και το GPT 4.5 κρίθηκε ως άνθρωπος σημαντικά συχνότερα από τους πραγματικούς ανθρώπους!" Το τεστ Turing οφείλει την ονομασία του στον Βρετανό μαθηματικό και επιστήμονα υπολογιστών Alan Turing. Το 1950, ο Turing πρότεινε μια μέθοδο για την αξιολόγηση της νοημοσύνης μιας μηχανής, η οποία περιλάμβανε συνομιλίες κειμένου μεταξύ ενός ανθρώπου-αξιολογητή και δύο συνομιλητών που βρίσκονταν εκτός οπτικού πεδίου: μιας μηχανής και ενός άλλου ανθρώπου. Ο ίδιος ο Turing αναφερόταν σε αυτή τη διαδικασία ως "παιχνίδι μίμησης". Στην πρόσφατη μελέτη, οι ερευνητές διεξήγαγαν το περίφημο πείραμα σε μια διαδικτυακή πλατφόρμα. Για οκτώ γύρους, ένα δείγμα σχεδόν 300 συμμετεχόντων τοποθετήθηκε τυχαία είτε ως ανακριτής είτε ως ένας από τους δύο "μάρτυρες" που ανακρίνονται, με τον άλλο "μάρτυρα" να είναι ένα chatbot. Ένα βασικό σημείο εδώ είναι πώς προγραμματίστηκαν τα μοντέλα AI. Ένας τύπος ήταν η προτροπή "χωρίς προσωπικότητα", όπου η AI έλαβε μόνο βασικές οδηγίες. Για την προτροπή "προσωπικότητας", από την άλλη πλευρά, η AI ενημερώθηκε συγκεκριμένα να υιοθετήσει συγκεκριμένο χαρακτήρα, όπως ένα νεαρό άτομο με γνώσεις για το διαδίκτυο και τον πολιτισμό. Οι οδηγίες αυτές έκαναν τεράστια διαφορά. Χωρίς προτροπή προσωπικότητας, το GPT-4.5 πέτυχε συνολικό ποσοστό επιτυχίας μόλις 36%, σημαντικά χαμηλότερο από το 73% που θριάμβευσε στο Turing. Ως βάση, το GPT-4o, που τροφοδοτεί την τρέχουσα έκδοση του ChatGPT και έλαβε μόνο προτροπές χωρίς προσωπικότητα, πέτυχε ένα ακόμη λιγότερο πειστικό 21%. (Κάπως, το αρχαίο ELIZA ξεπέρασε οριακά το κορυφαίο μοντέλο της OpenAI με ποσοστό επιτυχίας 23%.) Ωστόσο, όπως επισημαίνει ο Jones, τα αποτελέσματα δεν σημαίνουν απαραίτητα ότι τα LLMs είναι ευφυή όπως οι άνθρωποι. "Νομίζω ότι είναι μια πολύ περίπλοκη ερώτηση...", έγραψε ο Jones στο Twitter. "Αλλά γενικά πιστεύω ότι αυτό θα πρέπει να αξιολογηθεί ως ένα από τα πολλά πρόσθετα στοιχεία για το είδος της νοημοσύνης που εμφανίζουν τα LLMs." "Πιστεύω ότι τα αποτελέσματα παρέχουν περισσότερες αποδείξεις ότι τα LLMs θα μπορούσαν να υποκαταστήσουν τους ανθρώπους σε σύντομες αλληλεπιδράσεις χωρίς κανείς να μπορεί να το καταλάβει", πρόσθεσε. "Αυτό θα μπορούσε δυνητικά να οδηγήσει σε αυτοματοποίηση θέσεων εργασίας, βελτιωμένες επιθέσεις κοινωνικής μηχανικής και γενικότερη κοινωνική αναστάτωση." Ο Jones κλείνει τονίζοντας ότι το τεστ Turing δεν βάζει μόνο τις μηχανές κάτω από το μικροσκόπιο - αντικατοπτρίζει επίσης τις συνεχώς εξελισσόμενες αντιλήψεις των ανθρώπων για την τεχνολογία. Έτσι τα αποτελέσματα δεν είναι στατικά: ίσως καθώς το κοινό εξοικειώνεται περισσότερο με την αλληλεπίδραση με την τεχνητή νοημοσύνη, θα γίνει καλύτερο και στον εντοπισμό της.
-
Όπως αναφέρε στο blog της εταιρείας, το Maverick είναι "ο ακούραστης εργάτης" των δύο και διαπρέπει στην κατανόηση εικόνας και κειμένου για "γενικές περιπτώσεις χρήσης βοηθού και συνομιλίας", ενώ το μικρότερο μοντέλο Scout θα μπορούσε να αντιμετωπίσει θέματα όπως "συνοψίσεις πολλαπλών εγγράφων, ανάλυση εκτεταμένης δραστηριότητας χρήστη για εξατομικευμένες εργασίες και συλλογισμό σε τεράστιες βάσεις κώδικα". Η εταιρεία παρουσίασε επίσης το Llama 4 Behemoth, ένα επερχόμενο μοντέλο που, όπως αναφέρει, είναι "μεταξύ των εξυπνότερων LLM στον κόσμο". Ο Διευθύνων Σύμβουλος Mark Zuckerberg δήλωσε ότι θα ακούσουμε για ένα τέταρτο μοντέλο, το Llama 4 Reasoning, "τον επόμενο μήνα". Τόσο το Maverick όσο και το Scout είναι διαθέσιμα για λήψη από τον ιστότοπο του Llama και το Hugging Face, και έχουν προστεθεί στο Meta AI, συμπεριλαμβανομένων των εφαρμογών WhatsApp, Messenger και Instagram DMs. Σύμφωνα με τη Meta, το Scout διαθέτει 17 δισεκατομμύρια ενεργές παραμέτρους με 16 ειδικούς. Όπως ανέφερε ο Zuckerberg, "Είναι εξαιρετικά γρήγορο, εγγενώς πολυτροπικό και διαθέτει ένα κορυφαίο στον κλάδο, σχεδόν άπειρο μήκος πλαισίου 10 εκατομμυρίων tokens, και είναι σχεδιασμένο να λειτουργεί σε μία μόνο GPU". Το Maverick από την άλλη πλευρά έχει 17 δισεκατομμύρια ενεργές παραμέτρους με 128 ειδικούς. Η εταιρεία υποστηρίζει ότι ξεπερνά ανταγωνιστές όπως το GPT-4o και το Gemini 2.0 σε δοκιμές κώδικα, συλλογισμού, πολυγλωσσικότητας, μακρού πλαισίου και εικόνας, και είναι εφάμιλλο του DeepSeek v3.1 σε συλλογισμό και κωδικοποίηση. Ο Zuckerberg ήδη χαρακτηρίζει το επερχόμενο μοντέλο Behemoth, το οποίο βρίσκεται ακόμη σε φάση εκπαίδευσης, ως "το υψηλότερης απόδοσης βασικό μοντέλο στον κόσμο", με 288 δισεκατομμύρια ενεργές παραμέτρους, σύμφωνα με την εταιρεία. Αν και το Behemoth δεν είναι ακόμη διαθέσιμο, είναι πιθανό να ακούσουμε περισσότερα για αυτό και το μοντέλο Reasoning σύντομα. Το μεγάλο συνέδριο προγραμματιστών AI της Meta, το LlamaCon, είναι μόλις λίγες εβδομάδες μακριά, όπου αναμένεται να παρουσιαστούν περισσότερες λεπτομέρειες. Τα νέα μοντέλα της Meta αποτελούν σημαντική εξέλιξη στον τομέα της τεχνητής νοημοσύνης, καθώς προσφέρουν προηγμένες δυνατότητες επεξεργασίας εικόνας και κειμένου, ενώ παράλληλα είναι προσβάσιμα μέσω πολλαπλών πλατφορμών της εταιρείας, διευρύνοντας έτσι τις δυνατότητες χρήσης της τεχνολογίας AI σε καθημερινές εφαρμογές.