Αναζήτηση στην κοινότητα
Εμφάνιση αποτελεσμάτων για τις ετικέτες 'GPT-5'.
4 αποτελέσματα
-
Η OpenAI ανακοίνωσε πριν λίγο την οικογένεια μοντέλων GPT-4.1, την πιο πρόσφατη σειρά μοντέλων τεχνητής νοημοσύνης που φέρνει για πρώτη φορά ένα παράθυρο πλαισίου 1 εκατομμυρίου tokens. Συγκεκριμένα η ανακοίνωση αφορά τρία νέα μοντέλα: GPT-4.1, GPT-4.1 mini και GPT-4.1 nano, με την OpenAI να συνεχίζει μια μακρά παράδοση ονομασίας νέων μοντέλων AI που μπερδεύει αρκετά. Σύμφωνα με την OpenAI, τα νέα μοντέλα ξεπερνούν το GPT-4o σε αρκετούς βασικούς τομείς. Ωστόσο, σε μια ασυνήθιστη κίνηση, το GPT-4.1 θα είναι διαθέσιμο μόνο μέσω του API για προγραμματιστές και όχι στο περιβάλλον του ChatGPT για καταναλωτές, όπου οι περισσότεροι χρήστες αλληλεπιδρούν με την τεχνολογία της OpenAI. Το παράθυρο πλαισίου 1 εκατομμυρίου tokens - που αντιπροσωπεύει ουσιαστικά την ποσότητα κειμένου που μπορεί να επεξεργαστεί η AI ταυτόχρονα - επιτρέπει σε αυτά τα μοντέλα να επεξεργάζονται περίπου 3.000 σελίδες κειμένου σε μία μόνο συνομιλία. Η επίδοση αυτή φέρνει τα παράθυρα πλαισίου της OpenAI στο ίδιο επίπεδο με τα μοντέλα Gemini της Google, τα οποία προσφέρουν παρόμοιες δυνατότητες εκτεταμένου πλαισίου εδώ και καιρό. Παράλληλα, η εταιρεία ανακοίνωσε ότι θα αποσύρει το μοντέλο GPT-4.5 Preview από το API - μια προσωρινή προσφορά που ξεκίνησε τον Φεβρουάριο και που ένας κριτικός αποκάλεσε "λεμόνι" - δίνοντας στους προγραμματιστές προθεσμία μέχρι τον Ιούλιο του 2025 για να αλλάξουν σε κάτι άλλο. Ωστόσο, φαίνεται ότι το GPT-4.5 θα παραμείνει στο ChatGPT προς το παρόν. Ο CEO της OpenAI Sam Altman είχε αναγνωρίσει τη συνήθεια της OpenAI να δίνει τρομερά ονόματα στα προϊόντα της τον Φεβρουάριο, όταν συζητούσε δημόσια τo roadmap της προς το πολυαναμενόμενο (και ακόμα θεωρητικό) GPT-5. Ο στόχος για το GPT-5 θα είναι η ενοποίηση, μια κίνηση branding για την ενοποίηση των μοντέλων της σειράς-o και των μοντέλων της σειράς GPT. Συγκριτικά με το GPT-4.5 Preview που θα αποσυρθεί σύντομα, η εικόνα γίνεται πολύ πιο περίπλοκη. Ενώ το GPT-4.1 έχει σημαντικά καλύτερες επιδόσεις στη συγκριτική αξιολόγηση κώδικα SWE-bench Verified (54,6% έναντι 38,0% για το GPT-4.5) και παράγει κώδικα πιο αξιόπιστα, τα δεδομένα συγκριτικής αξιολόγησης της OpenAI αποκαλύπτουν ότι το GPT-4.5 εξακολουθεί να έχει καλύτερες επιδόσεις σε πολλές περιπτώσεις. Μερικές απ' αυτές είναι τα ακαδημαϊκά τεστ γνώσεων, στο να ακολουθεί οδηγίες καθώς και σε διάφορες εργασίες που περιλαμβάνουν τις πολυτροπικές δυνατότητές του και ειδικότερα αυτές που αφορούν την "όραση" του μοντέλου όπου αναγνωρίζει ότι βλέπει. Τα νέα μοντέλα έρχονται με χαμηλότερες τιμές σε σύγκριση με τους προκατόχους τους. Το GPT-4.1 κοστίζει $2 ανά εκατομμύριο tokens για είσοδο και $8 ανά εκατομμύριο tokens για έξοδο, αντιπροσωπεύοντας μείωση κόστους 26% για τα μέσα ερωτήματα σε σύγκριση με το GPT-4o. Το GPT-4.1 mini τιμάται στα $0,40 για είσοδο και $1,60 για έξοδο ανά εκατομμύριο tokens, ενώ το GPT-4.1 nano κοστίζει μόλις $0,10 για είσοδο και $0,40 για έξοδο ανά εκατομμύριο tokens. Συγκριτικά, η τιμολόγηση του GPT-4.5 ήταν εξαιρετικά υψηλή - κοστίζοντας $75 ανά εκατομμύριο tokens εισόδου και $150 ανά εκατομμύριο tokens εξόδου μέσω του API. Σύμφωνα με την OpenAI, πολλές βελτιώσεις από αυτά τα ερευνητικά μοντέλα "έχουν ενσωματωθεί σταδιακά στην τελευταία έκδοση του GPT-4o" στο ChatGPT, με περισσότερα χαρακτηριστικά να προγραμματίζονται για μελλοντικές ενημερώσεις. Ουσιαστικά, το GPT-4o του ChatGPT έχει γίνει ένα συνεχώς εξελισσόμενο μοντέλο "οδηγός" που απορροφά δυνατότητες από τα διάφορα ερευνητικά μοντέλα της εταιρείας με την πάροδο του χρόνου. Αυτό δημιουργεί ένα σύστημα δύο κατευθύνσεων: οι προγραμματιστές που χρησιμοποιούν το API λαμβάνουν συγκεκριμένα, συνεπή μοντέλα με σαφώς καθορισμένες δυνατότητες, ενώ οι κανονικοί χρήστες του ChatGPT λαμβάνουν ένα μόνο μοντέλο που αλλάζει στο παρασκήνιο. Διαβάστε ολόκληρο το άρθρο
-
Συγκεκριμένα η ανακοίνωση αφορά τρία νέα μοντέλα: GPT-4.1, GPT-4.1 mini και GPT-4.1 nano, με την OpenAI να συνεχίζει μια μακρά παράδοση ονομασίας νέων μοντέλων AI που μπερδεύει αρκετά. Σύμφωνα με την OpenAI, τα νέα μοντέλα ξεπερνούν το GPT-4o σε αρκετούς βασικούς τομείς. Ωστόσο, σε μια ασυνήθιστη κίνηση, το GPT-4.1 θα είναι διαθέσιμο μόνο μέσω του API για προγραμματιστές και όχι στο περιβάλλον του ChatGPT για καταναλωτές, όπου οι περισσότεροι χρήστες αλληλεπιδρούν με την τεχνολογία της OpenAI. Το παράθυρο πλαισίου 1 εκατομμυρίου tokens - που αντιπροσωπεύει ουσιαστικά την ποσότητα κειμένου που μπορεί να επεξεργαστεί η AI ταυτόχρονα - επιτρέπει σε αυτά τα μοντέλα να επεξεργάζονται περίπου 3.000 σελίδες κειμένου σε μία μόνο συνομιλία. Η επίδοση αυτή φέρνει τα παράθυρα πλαισίου της OpenAI στο ίδιο επίπεδο με τα μοντέλα Gemini της Google, τα οποία προσφέρουν παρόμοιες δυνατότητες εκτεταμένου πλαισίου εδώ και καιρό. Παράλληλα, η εταιρεία ανακοίνωσε ότι θα αποσύρει το μοντέλο GPT-4.5 Preview από το API - μια προσωρινή προσφορά που ξεκίνησε τον Φεβρουάριο και που ένας κριτικός αποκάλεσε "λεμόνι" - δίνοντας στους προγραμματιστές προθεσμία μέχρι τον Ιούλιο του 2025 για να αλλάξουν σε κάτι άλλο. Ωστόσο, φαίνεται ότι το GPT-4.5 θα παραμείνει στο ChatGPT προς το παρόν. Ο CEO της OpenAI Sam Altman είχε αναγνωρίσει τη συνήθεια της OpenAI να δίνει τρομερά ονόματα στα προϊόντα της τον Φεβρουάριο, όταν συζητούσε δημόσια τo roadmap της προς το πολυαναμενόμενο (και ακόμα θεωρητικό) GPT-5. Ο στόχος για το GPT-5 θα είναι η ενοποίηση, μια κίνηση branding για την ενοποίηση των μοντέλων της σειράς-o και των μοντέλων της σειράς GPT. Συγκριτικά με το GPT-4.5 Preview που θα αποσυρθεί σύντομα, η εικόνα γίνεται πολύ πιο περίπλοκη. Ενώ το GPT-4.1 έχει σημαντικά καλύτερες επιδόσεις στη συγκριτική αξιολόγηση κώδικα SWE-bench Verified (54,6% έναντι 38,0% για το GPT-4.5) και παράγει κώδικα πιο αξιόπιστα, τα δεδομένα συγκριτικής αξιολόγησης της OpenAI αποκαλύπτουν ότι το GPT-4.5 εξακολουθεί να έχει καλύτερες επιδόσεις σε πολλές περιπτώσεις. Μερικές απ' αυτές είναι τα ακαδημαϊκά τεστ γνώσεων, στο να ακολουθεί οδηγίες καθώς και σε διάφορες εργασίες που περιλαμβάνουν τις πολυτροπικές δυνατότητές του και ειδικότερα αυτές που αφορούν την "όραση" του μοντέλου όπου αναγνωρίζει ότι βλέπει. Τα νέα μοντέλα έρχονται με χαμηλότερες τιμές σε σύγκριση με τους προκατόχους τους. Το GPT-4.1 κοστίζει $2 ανά εκατομμύριο tokens για είσοδο και $8 ανά εκατομμύριο tokens για έξοδο, αντιπροσωπεύοντας μείωση κόστους 26% για τα μέσα ερωτήματα σε σύγκριση με το GPT-4o. Το GPT-4.1 mini τιμάται στα $0,40 για είσοδο και $1,60 για έξοδο ανά εκατομμύριο tokens, ενώ το GPT-4.1 nano κοστίζει μόλις $0,10 για είσοδο και $0,40 για έξοδο ανά εκατομμύριο tokens. Συγκριτικά, η τιμολόγηση του GPT-4.5 ήταν εξαιρετικά υψηλή - κοστίζοντας $75 ανά εκατομμύριο tokens εισόδου και $150 ανά εκατομμύριο tokens εξόδου μέσω του API. Σύμφωνα με την OpenAI, πολλές βελτιώσεις από αυτά τα ερευνητικά μοντέλα "έχουν ενσωματωθεί σταδιακά στην τελευταία έκδοση του GPT-4o" στο ChatGPT, με περισσότερα χαρακτηριστικά να προγραμματίζονται για μελλοντικές ενημερώσεις. Ουσιαστικά, το GPT-4o του ChatGPT έχει γίνει ένα συνεχώς εξελισσόμενο μοντέλο "οδηγός" που απορροφά δυνατότητες από τα διάφορα ερευνητικά μοντέλα της εταιρείας με την πάροδο του χρόνου. Αυτό δημιουργεί ένα σύστημα δύο κατευθύνσεων: οι προγραμματιστές που χρησιμοποιούν το API λαμβάνουν συγκεκριμένα, συνεπή μοντέλα με σαφώς καθορισμένες δυνατότητες, ενώ οι κανονικοί χρήστες του ChatGPT λαμβάνουν ένα μόνο μοντέλο που αλλάζει στο παρασκήνιο.
-
Πολλά και ενδιαφέροντα είχε να πει ο Μουσταφά Σουλεϊμάν για το GPT-5
Snoob δημοσίευσε ένα άρθρο στο Artificial Intelligence
Η συνέντευξη του Μουσταφά Σουλεϊμάν ήταν με τον επενδυτή Σεθ Ρόζενμπεργκ, με τους δύο άντρες να συζητούν ένα ευρύ φάσμα θεμάτων, σχετικά με το μέλλον της δημιουργικής τεχνητής νοημοσύνης και την απόπειρα "καθορισμού της έννοιας της νοημοσύνης". Ο Ρόζενμπεργκ ζητά την άποψη του Σουλεϊμάν για τους αυτόνομους πράκτορες και το κατά πόσο τα chatbot στα οποία έχουμε ήδη πρόσβαση απέχουν από το να φτάσουν σε αυτό το επίπεδο. "Παραμένει αρκετά δύσκολο να κάνεις αυτά τα μοντέλα να ακολουθούν οδηγίες που περιλαμβάνουν λεπτές έννοιες για παρατεταμένα διαστήματα", απαντά ο Σουλεϊμάν. "Το να μπορέσεις να τα κάνεις πραγματικά να αποδίδουν σταθερά, σε καινοφανή περιβάλλοντα, είναι αρκετά δύσκολο. Νομίζω πως θα χρειαστεί όχι μία αλλά δύο τάξεις μεγέθους μεγαλύτερη υπολογιστική ισχύς για την εκπαίδευση των μοντέλων. Επομένως, όχι το GPT-5 αλλά μάλλον μοντέλα της κλίμακας του GPT-6. Νομίζω πως μιλάμε για δύο χρόνια μέχρι να έχουμε συστήματα τα οποία μπορούν πράγματι να αναλάβουν δράση". Υπάρχουν ορισμένα ενδιαφέροντα στοιχεία, σε αυτά τα σχόλια. Κατ' αρχάς, το χρονικό πλαίσιο δεν συμπίπτει ακριβώς με αυτό που προέκυψε από πρόσφατη συνέντευξη με θέμα το GPT-5 που παραχώρησε η Μίρα Μουράτι, CTO της OpenAI, πριν από λίγες μόλις ημέρες. Η Μουράτι δεν αναφέρθηκε συγκεκριμένα στο GPT-5, όμως σαφέστατα το περιέγραψε ως μοντέλο επόμενης γενιάς. "Αν παρατηρήσει κανείς την τροχιά της βελτίωσης, συστήματα όπως το GPT-3 διέθεταν ευφυία αντίστοιχη με ενός νηπίου, ενδεχομένως", είπε η Μουράτι. "Ύστερα, συστήματα όπως το GPT-4 κινούνται στο επίπεδο ενός ευφυούς μαθητή λυκείου. Στην πορεία, στα επόμενα δύο-τρία χρόνια, συζητάμε για ευφυία επιπέδου διδακτορικού, για συγκεκριμένες διαδικασίες. Τα πράγματα αλλάζουν και βελτιώνονται πολύ γρήγορα". Από ό,τι φαίνεται, τόσο η Μουράτι όσο και ο Σουλεϊμάν περιγράφουν το ίδιο επόμενο ορόσημο στην εξέλιξη της τεχνητής νοημοσύνης, άσχετα με το πώς θα ονομάζεται. Βέβαια, είναι κάπως παράξενο το ότι ο Σουλεϊμάν αναφέρεται συγκεκριμένα τόσο στο GPT-5 όσο και το GPT-6, σχολιάζοντας ότι το GPT-6 απέχει μόλις δύο χρόνια. Αυτό, βέβαια, σημαίνει ότι το GPT-5 πρόκειται να εμφανιστεί αργότερα μέσα στο 2024, ώστε να πάρει σειρά το GPT-6 την επόμενη χρονιά, ενδεχομένως. Εναλλακτικά, όπως αφήνει να εννοηθεί η Μουράτι, μήπως θα χρειαστεί να περιμένουμε δύο χρόνια, μέχρι να δούμε μια σημαντική βελτίωση στις δυνατότητες του GPT; Αυτό, παραμένει ασαφές. Το GPT-5 φημολογείται εδώ και καιρό ότι πρόκειται να κυκλοφορήσει, αρχικά στα τέλη του 2023 και, ξανά, αυτό το καλοκαίρι. Πέρα από το χρονικό πλαίσιο, όμως, ο Σουλεϊμάν έχει ορισμένες ενδιαφέρουσες σκέψεις να μοιραστεί, σχετικά με το πού οδεύει η όλη κατάσταση. "Κατ' αρχάς, δεν νομίζω ότι βρισκόμαστε σε πορεία προς την πλήρη αυτονομία. Νομίζω πως αυτό είναι, στην πραγματικότητα, μάλλον ανεπιθύμητο", είπε. "Νομίζω ότι η πλήρης αυτονομία είναι εξόχως επικίνδυνη. Αν έχεις έναν πράκτορα ικανό να διαμορφώνει δικά του σχέδια, να καθορίζει δικούς του στόχους, να εξασφαλίζει δικούς του πόρους...αντικειμενικά μιλώντας, αυτό μάλλον επικίνδυνο θα αποδειχτεί, παρά το αντίθετο". Αντίθετα, ο Σουλεϊμάν υποστηρίζει ότι κινούμαστε προς κάποιες "στενές λωρίδες αυτονομίας", στο πλαίσιο των οποίων ένας πράκτορας τεχνητής νοημοσύνης θα μπορούσε να αξιοποιηθεί για τη διαχείριση ενός συγκεκριμένου έργου που απαιτεί κάποιο βαθμό λογικής και σχεδιασμού, αλλά θα περιορίζεται από κάποια στενά όρια. Ο Σουλεϊμάν θεωρεί ότι τα ρυθμιστικά πλαίσια είναι η λύση ώστε να διατηρηθεί η κατάσταση υπό έλεγχο. Αναφέρθηκε επίσης στο έργο του στη Microsoft αυτό το διάστημα πάνω στο Copilot, καθώς ρυθμίζουν τα μοντέλα της OpenAI ώστε να λειτουργούν περισσότερο βάση της μνήμης και της εξατομίκευσης. Υπενθυμίζεται ότι ο Σουλεϊμάν εντάχθηκε στη Microsoft μόλις το Μάρτιο, όμως συγκαταλέγεται μεταξύ των πρωτοπόρων στον τομέα της τεχνητής νοημοσύνης, ενώ υπήρξε συνιδρυτής και άλλοτε επικεφαλής της DeepMind, της εταιρίας ανάπτυξης τεχνητής νοημοσύνης την οποία εξαγόρασε στη συνέχεια η Google. -
Ο επικεφαλής της Microsoft AI σε πρόσφατη συνέντευξή του έδωσε αρκετά στοιχεία για το GPT-5 αλλά και τη μορφή που θα μπορούσε να έχει ο διάδοχός του. Η συνέντευξη του Μουσταφά Σουλεϊμάν ήταν με τον επενδυτή Σεθ Ρόζενμπεργκ, με τους δύο άντρες να συζητούν ένα ευρύ φάσμα θεμάτων, σχετικά με το μέλλον της δημιουργικής τεχνητής νοημοσύνης και την απόπειρα "καθορισμού της έννοιας της νοημοσύνης". Ο Ρόζενμπεργκ ζητά την άποψη του Σουλεϊμάν για τους αυτόνομους πράκτορες και το κατά πόσο τα chatbot στα οποία έχουμε ήδη πρόσβαση απέχουν από το να φτάσουν σε αυτό το επίπεδο. "Παραμένει αρκετά δύσκολο να κάνεις αυτά τα μοντέλα να ακολουθούν οδηγίες που περιλαμβάνουν λεπτές έννοιες για παρατεταμένα διαστήματα", απαντά ο Σουλεϊμάν. "Το να μπορέσεις να τα κάνεις πραγματικά να αποδίδουν σταθερά, σε καινοφανή περιβάλλοντα, είναι αρκετά δύσκολο. Νομίζω πως θα χρειαστεί όχι μία αλλά δύο τάξεις μεγέθους μεγαλύτερη υπολογιστική ισχύς για την εκπαίδευση των μοντέλων. Επομένως, όχι το GPT-5 αλλά μάλλον μοντέλα της κλίμακας του GPT-6. Νομίζω πως μιλάμε για δύο χρόνια μέχρι να έχουμε συστήματα τα οποία μπορούν πράγματι να αναλάβουν δράση". Υπάρχουν ορισμένα ενδιαφέροντα στοιχεία, σε αυτά τα σχόλια. Κατ' αρχάς, το χρονικό πλαίσιο δεν συμπίπτει ακριβώς με αυτό που προέκυψε από πρόσφατη συνέντευξη με θέμα το GPT-5 που παραχώρησε η Μίρα Μουράτι, CTO της OpenAI, πριν από λίγες μόλις ημέρες. Η Μουράτι δεν αναφέρθηκε συγκεκριμένα στο GPT-5, όμως σαφέστατα το περιέγραψε ως μοντέλο επόμενης γενιάς. "Αν παρατηρήσει κανείς την τροχιά της βελτίωσης, συστήματα όπως το GPT-3 διέθεταν ευφυία αντίστοιχη με ενός νηπίου, ενδεχομένως", είπε η Μουράτι. "Ύστερα, συστήματα όπως το GPT-4 κινούνται στο επίπεδο ενός ευφυούς μαθητή λυκείου. Στην πορεία, στα επόμενα δύο-τρία χρόνια, συζητάμε για ευφυία επιπέδου διδακτορικού, για συγκεκριμένες διαδικασίες. Τα πράγματα αλλάζουν και βελτιώνονται πολύ γρήγορα". Από ό,τι φαίνεται, τόσο η Μουράτι όσο και ο Σουλεϊμάν περιγράφουν το ίδιο επόμενο ορόσημο στην εξέλιξη της τεχνητής νοημοσύνης, άσχετα με το πώς θα ονομάζεται. Βέβαια, είναι κάπως παράξενο το ότι ο Σουλεϊμάν αναφέρεται συγκεκριμένα τόσο στο GPT-5 όσο και το GPT-6, σχολιάζοντας ότι το GPT-6 απέχει μόλις δύο χρόνια. Αυτό, βέβαια, σημαίνει ότι το GPT-5 πρόκειται να εμφανιστεί αργότερα μέσα στο 2024, ώστε να πάρει σειρά το GPT-6 την επόμενη χρονιά, ενδεχομένως. Εναλλακτικά, όπως αφήνει να εννοηθεί η Μουράτι, μήπως θα χρειαστεί να περιμένουμε δύο χρόνια, μέχρι να δούμε μια σημαντική βελτίωση στις δυνατότητες του GPT; Αυτό, παραμένει ασαφές. Το GPT-5 φημολογείται εδώ και καιρό ότι πρόκειται να κυκλοφορήσει, αρχικά στα τέλη του 2023 και, ξανά, αυτό το καλοκαίρι. Πέρα από το χρονικό πλαίσιο, όμως, ο Σουλεϊμάν έχει ορισμένες ενδιαφέρουσες σκέψεις να μοιραστεί, σχετικά με το πού οδεύει η όλη κατάσταση. "Κατ' αρχάς, δεν νομίζω ότι βρισκόμαστε σε πορεία προς την πλήρη αυτονομία. Νομίζω πως αυτό είναι, στην πραγματικότητα, μάλλον ανεπιθύμητο", είπε. "Νομίζω ότι η πλήρης αυτονομία είναι εξόχως επικίνδυνη. Αν έχεις έναν πράκτορα ικανό να διαμορφώνει δικά του σχέδια, να καθορίζει δικούς του στόχους, να εξασφαλίζει δικούς του πόρους...αντικειμενικά μιλώντας, αυτό μάλλον επικίνδυνο θα αποδειχτεί, παρά το αντίθετο". Αντίθετα, ο Σουλεϊμάν υποστηρίζει ότι κινούμαστε προς κάποιες "στενές λωρίδες αυτονομίας", στο πλαίσιο των οποίων ένας πράκτορας τεχνητής νοημοσύνης θα μπορούσε να αξιοποιηθεί για τη διαχείριση ενός συγκεκριμένου έργου που απαιτεί κάποιο βαθμό λογικής και σχεδιασμού, αλλά θα περιορίζεται από κάποια στενά όρια. Ο Σουλεϊμάν θεωρεί ότι τα ρυθμιστικά πλαίσια είναι η λύση ώστε να διατηρηθεί η κατάσταση υπό έλεγχο. Αναφέρθηκε επίσης στο έργο του στη Microsoft αυτό το διάστημα πάνω στο Copilot, καθώς ρυθμίζουν τα μοντέλα της OpenAI ώστε να λειτουργούν περισσότερο βάση της μνήμης και της εξατομίκευσης. Υπενθυμίζεται ότι ο Σουλεϊμάν εντάχθηκε στη Microsoft μόλις το Μάρτιο, όμως συγκαταλέγεται μεταξύ των πρωτοπόρων στον τομέα της τεχνητής νοημοσύνης, ενώ υπήρξε συνιδρυτής και άλλοτε επικεφαλής της DeepMind, της εταιρίας ανάπτυξης τεχνητής νοημοσύνης την οποία εξαγόρασε στη συνέχεια η Google. Διαβάστε ολόκληρο το άρθρο