Η OpenAI παρουσιάζει το o1, ένα νέο AI μοντέλο με ενισχυμένες ικανότητες συλλογισμού

Hal9000 · 13 Σεπτεμβρίου

Νέο μοντέλο τεχνητής νοημοσύνης από την OpenAI, με την κωδική ονομασία Strawberry και επίσημη ονομασία OpenAI o1, το οποίο υπόσχεται να φέρει σημαντικές βελτιώσεις στον τομέα του GenerativeAI, με ιδιαίτερη έμφαση στις ικανότητες συλλογισμού.

Το o1 διαφοροποιείται από προηγούμενα μοντέλα χάρη στην ικανότητά του να "σκέφτεται" πριν απαντήσει σε ερωτήσεις, χρησιμοποιώντας μια μέθοδο που η OpenAI αποκαλεί "αλυσίδα συλλογισμού".

Η προσέγγιση αυτή επιτρέπει στο o1 να αναλύει ολιστικά ένα πρόβλημα, σχεδιάζοντας εκ των προτέρων και εκτελώντας μια σειρά ενεργειών για μεγαλύτερο χρονικό διάστημα, προτού καταλήξει σε μια απάντηση. Ως αποτέλεσμα, το μοντέλο είναι ιδιαίτερα κατάλληλο για εργασίες που απαιτούν τη σύνθεση αποτελεσμάτων από πολλαπλές υποεργασίες, όπως η ανίχνευση εμπιστευτικών emails σε ένα δικηγορικό γραφείο ή ο σχεδιασμός στρατηγικής μάρκετινγκ προϊόντων.

Το o1 αποτελεί στην πραγματικότητα μια οικογένεια μοντέλων, με δύο εκδόσεις να είναι διαθέσιμες από σήμερα: το o1-preview και το o1-mini, μια μικρότερη, φθηνότερη και πιο αποδοτική έκδοση που στοχεύει κυρίως στη δημιουργία κώδικα.

Οι συνδρομητές του ChatGPT Plus και Team έχουν ήδη πρόσβαση στο o1 μέσω του ChatGPT, ενώ οι εταιρικοί και εκπαιδευτικοί χρήστες θα αποκτήσουν πρόσβαση στις αρχές της επόμενης εβδομάδας. Ωστόσο, η εμπειρία χρήσης του o1 chatbot είναι προς το παρόν αρκετά περιορισμένη. Σε αντίθεση με τον προκάτοχό του, το GPT-4o, το o1 δεν μπορεί ακόμη να περιηγηθεί στο διαδίκτυο ή να αναλύσει αρχεία. Επιπλέον, αν και διαθέτει λειτουργίες ανάλυσης εικόνων, αυτές έχουν απενεργοποιηθεί προσωρινά για περαιτέρω δοκιμές.

Ένα σημαντικό μειονέκτημα του o1 είναι το υψηλό κόστος χρήσης του. Με χρήση του API, το o1-preview κοστίζει 15 δολάρια ανά 1 εκατομμύριο tokens εισόδου (input) και 60 δολάρια ανά 1 εκατομμύριο tokens εξόδου (output), κόστος που αντιστοιχεί σε τριπλάσιο κόστος σε σύγκριση με το GPT-4o για input ενέργειες και τετραπλάσιο για output.

Σύμφωνα με τον Noam Brown, ερευνητή επιστήμονα στην OpenAI, το o1 έχει εκπαιδευτεί με ενισχυτική μάθηση, η οποία διδάσκει στο σύστημα να "σκέφτεται" πριν απαντήσει μέσω μιας ιδιωτικής αλυσίδας σκέψης. Ο Brown ανέφερε επίσης ότι η OpenAI χρησιμοποίησε έναν νέο αλγόριθμο βελτιστοποίησης και ένα σύνολο δεδομένων εκπαίδευσης που περιέχει "δεδομένα συλλογισμού" και επιστημονική βιβλιογραφία ειδικά προσαρμοσμένα για εργασίες συλλογισμού.

Ο Pablo Arredondo, Αντιπρόεδρος της Thomson Reuters, ο οποίος είχε την ευκαιρία να δοκιμάσει το o1, δήλωσε στο TechCrunch ότι το μοντέλο είναι καλύτερο από τα προηγούμενα μοντέλα της OpenAI σε τομείς όπως η ανάλυση νομικών εγγράφων και η εύρεση λύσεων σε λογικά παιχνίδια τύπου LSAT. Ο Arredondo πρόσθεσε ότι παρατήρησαν το o1 να αντιμετωπίζει πιο ουσιαστικές και πολύπλευρες αναλύσεις.

Η OpenAI ισχυρίζεται ότι σε εξετάσεις για τη Διεθνή Μαθηματική Ολυμπιάδα, το o1 έλυσε σωστά το 83% των προβλημάτων, ενώ το GPT-4o αντίστοιχα μόνο το 13%. Επιπλέον, η εταιρεία αναφέρει ότι το o1 έφτασε στο 89ο εκατοστημόριο των συμμετεχόντων σε διαγωνισμούς προγραμματισμού Codeforces.

Ωστόσο, το o1 δεν είναι τέλειο αφού μπορεί να είναι πιο αργό από άλλα μοντέλα, ανάλογα με το ερώτημα. Ο Arredondo ανέφερε ότι το o1 μπορεί να χρειαστεί πάνω από 10 δευτερόλεπτα για να απαντήσει σε ορισμένες ερωτήσεις. Επιπλέον, ο Brown παραδέχτηκε ότι το o1 μπορεί να κάνει λάθη σε παιχνίδια όπως η τρίλιζα. Ο Ethan Mollick, καθηγητής διοίκησης στο Wharton, ο οποίος χρησιμοποίησε το o1 για ένα μήνα, ανέφερε ότι το μοντέλο τα πήγε καλά σε ένα δύσκολο σταυρόλεξο, αλλά εξακολουθεί να κάνει λάθη και να έχει ψευδαισθήσεις.

Η OpenAI δεν είναι η μόνη εταιρεία που ερευνά αυτούς τους τύπους μεθόδων συλλογισμού για τη βελτίωση της ακρίβειας των μοντέλων. Ερευνητές της Google DeepMind δημοσίευσαν πρόσφατα μια μελέτη που δείχνει ότι δίνοντας στα μοντέλα περισσότερο χρόνο υπολογισμού και καθοδήγηση για την εκτέλεση αιτημάτων, η απόδοσή τους μπορεί να βελτιωθεί σημαντικά χωρίς πρόσθετες τροποποιήσεις.

Ο δημιουργός του ChatGPT σχεδιάζει να πειραματιστεί με μοντέλα o1 που θα μπορούν να συλλογίζονται για ώρες, ημέρες ή ακόμη και εβδομάδες για να ενισχύσουν περαιτέρω τις ικανότητες συλλογισμού τους. Ωστόσο, η πραγματική πρόκληση για την εταιρεία θα είναι να κάνει το o1 ευρέως διαθέσιμο και σε χαμηλότερο κόστος.

Η OpenAI ανέφερε ότι αποφάσισε να μην εμφανίζει τις ακατέργαστες "αλυσίδες σκέψεων" του o1 στο ChatGPT, εν μέρει λόγω "ανταγωνιστικού πλεονεκτήματος". Αντ' αυτού, η εταιρεία επέλεξε να εμφανίζει "περιλήψεις που δημιουργούνται από το μοντέλο" των αλυσίδων.

Διαβάστε ολόκληρο το άρθρο

Retromaniac · 13 Σεπτεμβρίου

Ωραία, τώρα με τόσα μοντέλα ΑΙ θέλουμε ακόμη ένα που θα μας συμβουλεύει ποιο από όλα να χρησιμοποιήσουμε για την εργασία που θέλουμε.

alejsalonica · 13 Σεπτεμβρίου

Θέλουν πολύ δουλειά ακόμα, με το ζόρι μαθαίνει από τα λάθη του.

Ζήτα του π.χ. να υπολογίσει πότε πέφτει μια διορία που είναι π.χ. 20 εργάσιμες. Ή πόσες εργάσιμες ημέρες είναι μέχρι τα Χριστούγεννα.

Tragic

ptriv1 · 13 Σεπτεμβρίου

Μας τα έχουν πρήξει με την OpenAI και το ChatGPT.

Nakis93 · 13 Σεπτεμβρίου

Έχω την εντύπωση ότι η ονοματοδοσία στην τεχνολογία γίνεται όλο και πιο περίπλοκη αναλογικά με το κατά πόσο ένα καινούριο προϊόν έχει ουσιαστική βελτίωση σε σχέση με το προηγούμενο. Σαν να θέλουν να μας μπερδέψουν ένα πράμα (βλέπε AMD, Intel στα mobile cpus).

teodoreh · 13 Σεπτεμβρίου

19 λεπτά πριν, Nakis93 είπε

Έχω την εντύπωση ότι η ονοματοδοσία στην τεχνολογία γίνεται όλο και πιο περίπλοκη αναλογικά με το κατά πόσο ένα καινούριο προϊόν έχει ουσιαστική βελτίωση σε σχέση με το προηγούμενο. Σαν να θέλουν να μας μπερδέψουν ένα πράμα (βλέπε AMD, Intel στα mobile cpus).

Αν σε μπερδεύουν τα ονόματα των επεξεργαστών και των καρτών γραφικών, ψάξτο λίγο με τα ονόματα των οθονών!

asmilon · 13 Σεπτεμβρίου

26 λεπτά πριν, ptriv1 είπε

Μας τα έχουν πρήξει με την OpenAI και το ChatGPT.

Σου τα εχουν πρηξει με την OpenAI, ChatGPT, Apple, Samsung, Tesla, Intel, AMD, NVDIA κλπ. Μηπως τελικα εισαι σε λαθος σελιδα;

keysmith · 13 Σεπτεμβρίου

Nakis93 · 13 Σεπτεμβρίου

3 λεπτά πριν, teodoreh είπε

Αν σε μπερδεύουν τα ονόματα των επεξεργαστών και των καρτών γραφικών, ψάξτο λίγο με τα ονόματα των οθονών!

Στις κάρτες προς το παρόν είναι μια χαρά οι ονομασίες τους. Καλά στις οθόνες δεν υπάρχει καμιά συνοχή

GamingMaster424 · 13 Σεπτεμβρίου

1 hour ago, alejsalonica said:

Θέλουν πολύ δουλειά ακόμα, με το ζόρι μαθαίνει από τα λάθη του.

Ζήτα του π.χ. να υπολογίσει πότε πέφτει μια διορία που είναι π.χ. 20 εργάσιμες. Ή πόσες εργάσιμες ημέρες είναι μέχρι τα Χριστούγεννα.

Tragic

Εδώ τις προάλλες του ζήτησα να μου ταξινομήσει γύρω στα 30 ονόματα σε αλφαβητική σειρά και μου έβαλε αυτά που ξεκινάνε με "Γ" μετά το "Δ" και το "Ε". Σε κάποια tasks είναι εντυπωσιακές οι δυνατότητές του, αλλά σε πολλά ακόμα βρίσκεται σε πολύ πρώιμο στάδιο.

Tlykog · 13 Σεπτεμβρίου

2 ώρες πριν, alejsalonica είπε

Θέλουν πολύ δουλειά ακόμα, με το ζόρι μαθαίνει από τα λάθη του.

Ζήτα του π.χ. να υπολογίσει πότε πέφτει μια διορία που είναι π.χ. 20 εργάσιμες. Ή πόσες εργάσιμες ημέρες είναι μέχρι τα Χριστούγεννα.

Tragic

Απ όσο γνωρίζω, εκτός και αν αυτό άλλαξε σε αυτή την έκδοση, δε μαθαίνει από τα λάθη του γενικά.

Μαθαίνει μόνο στα πλαίσια μιας συγκεκριμένης συνεδρίας. Δεν ενημερώνει, όμως, τη βάση δεδομένων του. Η ενημέρωση της βάσης του γίνει μόνο από το προσωπικό της εταιρεία. Αν πχ το ρωτήσεις κάτι και κάνει λάθος, στη συνέχεια του το εξηγήσεις και το καταλάβει, τότε όσο συνεχίζεις αυτή τη συνεδρία θα το θυμάται. Αν ανοίξεις καινούρια και του κάνεις την ίδια ερώτηση, πιθανόν να κάνει πάλι το ίδιο λάθος.

panther_512 · 13 Σεπτεμβρίου

3 minutes ago, Tlykog said:

Απ όσο γνωρίζω, εκτός και αν αυτό άλλαξε σε αυτή την έκδοση, δε μαθαίνει από τα λάθη του γενικά.

Μαθαίνει μόνο στα πλαίσια μιας συγκεκριμένης συνεδρίας. Δεν ενημερώνει, όμως, τη βάση δεδομένων του. Η ενημέρωση της βάσης του γίνει μόνο από το προσωπικό της εταιρεία. Αν πχ το ρωτήσεις κάτι και κάνει λάθος, στη συνέχεια του το εξηγήσεις και το καταλάβει, τότε όσο συνεχίζεις αυτή τη συνεδρία θα το θυμάται. Αν ανοίξεις καινούρια και του κάνεις την ίδια ερώτηση, πιθανόν να κάνει πάλι το ίδιο λάθος.

Πολύ σωστά.

Το μόνο που μπορούμε να κάνουμε είναι να δώσουμε feedback στις απαντήσεις, ώστε το προσωπικό της εταιρείας να το αξιολογήσει και να κάνει όπου μπορεί fine tuning το μοντέλο.

Tlykog · 13 Σεπτεμβρίου

9 λεπτά πριν, panther_512 είπε

Πολύ σωστά.

Το μόνο που μπορούμε να κάνουμε είναι να δώσουμε feedback στις απαντήσεις, ώστε το προσωπικό της εταιρείας να το αξιολογήσει και να κάνει όπου μπορεί fine tuning το μοντέλο.

Το έγραψα γιατί πολλοί πιστεύουν ότι εκπαιδεύεται άμεσα από τους χρήστες.

Η εκπαίδευση ενός AI μοντέλου έχει μία πιο εκτεταμένη διαδικασία ενημέρωσης.

Upogeios · 13 Σεπτεμβρίου

14 λεπτά πριν, Tlykog είπε

Απ όσο γνωρίζω, εκτός και αν αυτό άλλαξε σε αυτή την έκδοση, δε μαθαίνει από τα λάθη του γενικά.

Μαθαίνει μόνο στα πλαίσια μιας συγκεκριμένης συνεδρίας. Δεν ενημερώνει, όμως, τη βάση δεδομένων του. Η ενημέρωση της βάσης του γίνει μόνο από το προσωπικό της εταιρεία. Αν πχ το ρωτήσεις κάτι και κάνει λάθος, στη συνέχεια του το εξηγήσεις και το καταλάβει, τότε όσο συνεχίζεις αυτή τη συνεδρία θα το θυμάται. Αν ανοίξεις καινούρια και του κάνεις την ίδια ερώτηση, πιθανόν να κάνει πάλι το ίδιο λάθος.

10 λεπτά πριν, panther_512 είπε

Πολύ σωστά.

Το μόνο που μπορούμε να κάνουμε είναι να δώσουμε feedback στις απαντήσεις, ώστε το προσωπικό της εταιρείας να το αξιολογήσει και να κάνει όπου μπορεί fine tuning το μοντέλο.

ναι ρε παιδια, δε θα μπορουσε να ειναι διαφορετικα, αλλιως θα καταληξουμε με ενα μοντελο που πχ πιστευει στο θεο (μιας και οι περισσοτεροι, λενε πως, πιστευουν)

φυσικα και πρεπει να γινει ελενχος στο ΤΙ αλλα και στο ΠΩΣ θα παρει πραγματα ως δεδομενα, αλλωστε αν αυτο δεν γινει στο επιπεδο που πρεπει, δεν θα μπορει να μαθει ουτε ανα συνεδρια, αν το εχω πιασει καλα το πως λειτουργει!

fast8 · 13 Σεπτεμβρίου

"Ο δημιουργός του ChatGPT σχεδιάζει να πειραματιστεί με μοντέλα o1 που θα μπορούν να συλλογίζονται για ώρες, ημέρες ή ακόμη και εβδομάδες για να ενισχύσουν περαιτέρω τις ικανότητες συλλογισμού τους."

Μάλιστα, μετά απο bots που "σκέφτοναι", τώρα έχουμε και bots που "διαλογίζονται".

2 hours ago, alejsalonica said:

Θέλουν πολύ δουλειά ακόμα, με το ζόρι μαθαίνει από τα λάθη του.

Ζήτα του π.χ. να υπολογίσει πότε πέφτει μια διορία που είναι π.χ. 20 εργάσιμες. Ή πόσες εργάσιμες ημέρες είναι μέχρι τα Χριστούγεννα.

Tragic

Δεν μαθαίνουν απο τα λάθη τους γιατί η εκπαίδευση είναι χρονοβόρα και πολύπλοκη και δεν είναι live. Αλλά για τον κάθε έναν χρήστη κρατάει μια μνήμη με προηγούμενες συζητήσεις ώστε να δίνει εξατομικευμένες απαντήσεις. Πχ θυμάται τι υπολογιστή έχεις και ποια εργαλεία χρησιμοποιείς και σου δίνει απαντήσεις συγκεκριμένα για το hardware και το software που έχεις χωρίς να του το επαναλαμβάνεις κάθε φορά. Μέσα απο αυτή την διαδικασία θυμάται και τι του έχεις πει ότι είναι λάθος και μόνο για εσένα το θυμάται και το λαμβάνει υπόψη του.

Οσο αφορά το δεύτερο πρόβλημα που λες για τον υπολογισμό αριθμητικών προβλημάτων, είναι ακριβώς το σημείο που βελτιώθηκε το νέο μοντέλο σε εκπληκτικό βαθμό. Τώρα το o1-preview μπορεί το πρόβλημα σου.

Σύνδεση

Η OpenAI παρουσιάζει το o1, ένα νέο AI μοντέλο με ενισχυμένες ικανότητες συλλογισμού

Προτεινόμενες αναρτήσεις

Hal9000

Συχνή συμμετοχή στο θέμα

Δημοφιλείς Ημέρες

Συχνή συμμετοχή στο θέμα

Δημοφιλείς Ημέρες

Δημοφιλή Μηνύματα

Retromaniac

asmilon

Tlykog

Δημοσιευμένες Εικόνες

Retromaniac

alejsalonica

ptriv1

Nakis93

teodoreh

asmilon

keysmith

Nakis93

GamingMaster424

Tlykog

panther_512

Tlykog

Upogeios

fast8

Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε

Δημιουργία λογαριασμού

Σύνδεση

Retromaniac

asmilon

Tlykog

Σύνδεση