Προς το περιεχόμενο

Η OpenAI κυκλοφορεί την τρίτη έκδοση του DALL-E, της δημιουργικής γεννήτριας μετατροπής κειμένου σε εικόνα


alion

Προτεινόμενες αναρτήσεις

Η OpenAI παρουσίασε μια αναβαθμισμένη έκδοση της πρωτοποριακής γεννήτριας μετατροπής κειμένου σε εικόνα, DALL-E.

Η νέα έκδοση, με την ονομασία DALL-E 3, ενσωματώνει το ChatGPT, το εξαιρετικά δημοφιλές chatbot τεχνητής νοημοσύνης της OpenAI για συνομιλίες. Στόχος σύμφωνα με την εταιρεία είναι ο εξορθολογισμός και η βελτίωση της διαδικασίας περιγραφής της εικόνας που επιθυμεί ο χρήστης. Με το DALL-E 3, οι premium συνδρομητές των ChatGPT Plus και ChatGPT Enterprise μπορούν απλά να πληκτρολογήσουν ένα αίτημα για μια εικόνα στη διεπαφή συνομιλίας. Στη συνέχεια, το ChatGPT θα έχει μια συνομιλία με τον χρήστη για να κατανοήσει το αίτημα και να δημιουργήσει μια λεπτομερή προτροπή που παρέχει σαφέστερη καθοδήγηση στο DALL-E 3 για όσο το δυνατόν καλύτερο αποτέλεσμα. Αυτό επιτρέπει στους χρήστες να δημιουργούν περίπλοκες, υψηλής πιστότητας εικόνες χωρίς να χρειάζεται να σκέφτονται οι ίδιοι πολύπλοκες περιγραφές για να εισάγουν στο DALL-E 3.

Πέρα από την ενσωμάτωση του ChatGPT, το DALL-E 3 διαθέτει μια σειρά άλλων βελτιώσεων σε σχέση με τους προκατόχους του. Σύμφωνα με την OpenAI, το τελευταίο μοντέλο παράγει εικόνες υψηλότερης οπτικής ποιότητας που αντικατοπτρίζουν με μεγαλύτερη ακρίβεια τις παρεχόμενες περιγραφές των χρηστών. Αυτό ισχύει ιδιαίτερα για τις μακρύτερες, πιο λεπτομερείς προτροπές με τις οποίες οι προηγούμενες εκδόσεις δυσκολεύονταν. Το DALL-E 3 επιδεικνύει επίσης βελτιωμένο χειρισμό δύσκολου περιεχομένου όπως κείμενο και ανθρώπινα χέρια, στοιχεία που ιστορικά αποτελούσαν πρόκληση για τις γεννήτριες εικόνων AI.

Σε μια προσπάθεια να μειωθούν οι επιβλαβείς προκαταλήψεις της AI και να βελτιωθεί η ασφάλεια, το DALL-E 3 ενσωματώνει νέους μηχανισμούς για την απόρριψη μη ασφαλών ή ανήθικων αιτημάτων δημιουργίας εικόνων. Για παράδειγμα, δεν θα απεικονίζει το μοναδικό στυλ ζωντανών καλλιτεχνών χωρίς άδεια ή δεν θα δημιουργεί απεικονίσεις δημόσιων προσώπων. Επιπλέον, οι καλλιτέχνες μπορούν πλέον να μην επιθυμούν να χρησιμοποιηθεί το έργο τους για την εκπαίδευση μελλοντικών εκδόσεων του DALL-E. Η κίνηση αυτή ανταποκρίνεται στις αυξανόμενες ανησυχίες σχετικά με τις παραβιάσεις των πνευματικών δικαιωμάτων και της συγκατάθεσης από τα δημιουργικά μοντέλα τεχνητής νοημοσύνης που εκπαιδεύονται σε δημιουργίες καλλιτεχνών χωρίς έγκριση.

Το λανσάρισμα του DALL-E 3 έρχεται εν μέσω κλιμακούμενου ανταγωνισμού στον καυτό χώρο της δημιουργικής (ή γεννητικής) τεχνητής νοημοσύνης, ιδίως γύρω από τη δημιουργία συνθετικών εικόνων. Ανταγωνιστές όπως οι Midjourney και Stability AI συνεχίζουν να βελτιώνουν τα δικά τους μοντέλα, ωθώντας την OpenAI να παραμείνει στην αιχμή της καινοτομίας. Εκτός από τους συνδρομητές στη premium πρόταση της εταιρείας, η OpenAI σχεδιάζει να παρέχει πρόσβαση στο DALL-E 3 σε ερευνητικούς συνεργάτες και όσους χρησιμοποιούν το API της. Ωστόσο, παραμένει ασαφές αν ή πότε μπορεί να κυκλοφορήσει δημόσια μια δωρεάν έκδοση στο διαδίκτυο, όπως έγινε με το DALL-E 2 και το αρχικό DALL-E.

Με το DALL-E 3 να αξιοποιεί το ChatGPT για την απλοποίηση των περιγραφών καθώς και τη δημιουργία πιο λεπτομερών και αληθοφανών εικόνων, η OpenAI υπογραμμίζει την ηγετική της θέση στη δημιουργία συνθετικών εικόνων. Ωστόσο, οι ανταγωνιστές της παρέχουν εξίσου πολύ καλά αποτελέσματα -ίσως και καλύτερα ανά περιπτώσεις- οπότε οι περαιτέρω βελτιώσεις στην πιστότητα της εικόνας, τη δημιουργική ευελιξία και τις ηθικές εγγυήσεις θα είναι ζωτικής σημασίας για τη διατήρηση του ανταγωνιστικού πλεονεκτήματος στον ταχέως εξελισσόμενο τομέα της δημιουργικής τεχνητής νοημοσύνης. 


Διαβάστε ολόκληρο το άρθρο

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Έχω το plus αλλά ακόμα λέει ότι δεν μπορεί να σχεδιάσει εικόνες.

Πρέπει να ενεργοποιήσω κάποια ρύθμιση; Μήπως θέλει χρόνο για να γίνει διαθέσιμο σε όλους;

  • Like 1
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

3 hours ago, StavrosD said:

Έχω το plus αλλά ακόμα λέει ότι δεν μπορεί να σχεδιάσει εικόνες.

Πρέπει να ενεργοποιήσω κάποια ρύθμιση; Μήπως θέλει χρόνο για να γίνει διαθέσιμο σε όλους;

Είναι λίγο παραπλανητικό το κείμενο. Και εγώ το δοκίμασα και δεν δουλεύει.

Απ' το site της OpenAI

DALL·E 3 is now in research preview, and will be available to ChatGPT Plus and Enterprise customers in October, via the API and in Labs later this fall.

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Δημοσ. (επεξεργασμένο)

Από την στιγμή που θα χτυπήσουν consistency θα απογειωθούν χρηστικά. Μέχρι τώρα έμοιαζαν με bootleg εφαρμογή που έπρεπε να προσπαθήσεις εκατό φορές για να πιάσεις αυτό που ήθελες. και μετά για να κάνεις κάτι παρόμοιο σε άλλη εικόνα ήθελε άλλα τόσα.

Επεξ/σία από Diavolos666
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Νομίζω οτι η πρόοδος σε αυτά τα εργαλεία έχει τη δύναμη να "τελειώσει" όλους τους digital εικαστικούς καλλιτέχνες. Και πάλι βέβαια, ίσως κάποιος να ενδιαφερθεί να στηρίξει κάποιον δημιουργό αγοράζοντας commissioned work, αλλά θα είναι τόσο γρηγορότερο και φθηνότερο να παραγγείλει "μια πατάτα ντυμένη βασιλιά με κάπα και στέμμα" στο DALL-E που αμφιβάλλω πόσοι θα το επιλέγουν πια. Δεν ξέρω πόσο θα αγγίξει και τον κάδο της γραφιστικής

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

5 minutes ago, Abudi said:

Νομίζω οτι η πρόοδος σε αυτά τα εργαλεία έχει τη δύναμη να "τελειώσει" όλους τους digital εικαστικούς καλλιτέχνες. Και πάλι βέβαια, ίσως κάποιος να ενδιαφερθεί να στηρίξει κάποιον δημιουργό αγοράζοντας commissioned work, αλλά θα είναι τόσο γρηγορότερο και φθηνότερο να παραγγείλει "μια πατάτα ντυμένη βασιλιά με κάπα και στέμμα" στο DALL-E που αμφιβάλλω πόσοι θα το επιλέγουν πια. Δεν ξέρω πόσο θα αγγίξει και τον κάδο της γραφιστικής

Σε κάποια φάση θα τα ξεπεράσει όλα, στο stable diffusion ήδη έχει την δυνατότητα να δημιουργείς έναν χαρακτήρα και να του αλλάζει ςπόζες. Εξακολουθεί να μην είναι τόσο συνεχές το αποτέλεσμα αλλά προοδεύει με γρήγορη ταχύτητα.

Οι εικόνες που βγάζουν τα ΑΙ είναι ήδη πολύ ωραίες, το πρόβλημα παραμένει να μπορείς να δημιουργείς έναν χαρακτήρα με συγκεκριμένα χαρακτηριστικά και να τον βάζεις σε ότι πόζα θέλεις ή ότι φόντο θέλεις και γιατί όχι να του αλλάζεις και τεχνοτροπία, δηλαδή να τον πας από απλή ζωγραφιά σε τρισδιάστατη απεικόνιση, ή να τον μετατρέπεις σε πίνακα με λαδομπογιές ή με ξυλομπογιές κτλ. Αλλά όπως και να έχει να παραμένεις ο ίδιος αναγνωρίσιμος χαρακτήρας. Αυτό είναι που περιμένουν οι περισσότεροι.

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

1 minute ago, Diavolos666 said:

Σε κάποια φάση θα τα ξεπεράσει όλα, στο stable diffusion ήδη έχει την δυνατότητα να δημιουργείς έναν χαρακτήρα και να του αλλάζει ςπόζες. Εξακολουθεί να μην είναι τόσο συνεχές το αποτέλεσμα αλλά προοδεύει με γρήγορη ταχύτητα.

Οι εικόνες που βγάζουν τα ΑΙ είναι ήδη πολύ ωραίες, το πρόβλημα παραμένει να μπορείς να δημιουργείς έναν χαρακτήρα με συγκεκριμένα χαρακτηριστικά και να τον βάζεις σε ότι πόζα θέλεις ή ότι φόντο θέλεις και γιατί όχι να του αλλάζεις και τεχνοτροπία, δηλαδή να τον πας από απλή ζωγραφιά σε τρισδιάστατη απεικόνιση, ή να τον μετατρέπεις σε πίνακα με λαδομπογιές ή με ξυλομπογιές κτλ. Αλλά όπως και να έχει να παραμένεις ο ίδιος αναγνωρίσιμος χαρακτήρας. Αυτό είναι που περιμένουν οι περισσότεροι.

Δε σκέφτηκα καν το θέμα των 3D μοντέλων για video-games ή ακόμα και ταινίες, τώρα που το λες εκεί ίσως υπάρξει και ακόμα μεγαλύτερο disrupt.

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

5 hours ago, Abudi said:

Δε σκέφτηκα καν το θέμα των 3D μοντέλων για video-games ή ακόμα και ταινίες, τώρα που το λες εκεί ίσως υπάρξει και ακόμα μεγαλύτερο disrupt.

Σε σοβαρά projects που λειτουργούν με λεπτομέρεια χιλιοστού ακόμη ο animator είναι απαραίτητος. 

Το Ai μπορεί να δώσει μια αρχική ιδέα, όχι το τελικό αποτέλεσμα. 

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

10 ώρες πριν, Pokemon640 είπε

Σε σοβαρά projects που λειτουργούν με λεπτομέρεια χιλιοστού ακόμη ο animator είναι απαραίτητος. 

Το Ai μπορεί να δώσει μια αρχική ιδέα, όχι το τελικό αποτέλεσμα. 

Κάποια στιγμή όταν η δημιουργία μίας animated ταινίας ή ένα game χρειαστεί  μερικές ώρες άντε μέρες συζήτησης με ένα chatbot, κανένας δεν θα πληρώσει animators για να φτάσει την τελειότητα διότι ο σκοπός είναι το κέρδος. Δεν θα αλλάξει αυτό απ' την μία μέρα στην άλλη, αλλά σιγά σιγά θα κλείνουν τα studios που δεν υιοθετούν την νέα τεχνολογία.

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Δημοσ. (επεξεργασμένο)

Κι εκεί βέβαια έρχεται μια γενικότερη συζήτηση για το πόσο αξιολογεί η ανθρωπότητα, την τέχνη και τη δημιουργία, στο δίπολο "quality"-quantity. Τί θέλω να πω.

Το AI μπορεί να σου παράγει (όχι τώρα, σε 2-5 χρόνια) πάμφθηνα και πολύ γρήγορα σενάρια και animations για ταινίες, για video games. Να σου φτιάχνει το artwork για ένα έργο τέχνης σπίτι σου, ή για την ιστοσελίδα σου, ή το τατουάζ που φαντάζεσαι. Να σου παράγει δημοσιογραφικά άρθρα. Σχολικές ή πανεπιστημιακές εκθέσεις (και να μην είναι ούτε καν "συρραφή" αναρτημένων κειμένων αλλά πρωτότυπο).

Έχει αυτό αξία; Έχει αξία να να παραγγείλω από το AI ένα ψηφιακό πορτρέτο της κόρης μου με βάση μια φωτογραφία ή αξιολογώ ως πιο σημαντικό και το όραμα του καλλιτέχνη; Έχει αξία να διαβάσω μια άποψη για το ελληνικό πρωτάθλημα από ένα AI ή αξιολογώ σημαντικό και το input της προσωπικότητας του δημοσιογράφου που θα γράψει ένα άρθρο;

Γυρνάμε δηλαδή σε ένα δίλημμα που έχει να κάνει με την αποδοτικότητα, την παραγωγικότητα, το κόστος έναντι της ανθρώπινης δημιουργικότητας και εκφραστικής ελευθερίας. Ανησυχώ οτι δίνουμε πολύ μεγαλύτερη βαρύτητα στο πρώτο.

Επεξ/σία από Abudi
  • Like 2
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε

Πρέπει να είστε μέλος για να αφήσετε σχόλιο

Δημιουργία λογαριασμού

Εγγραφείτε με νέο λογαριασμό στην κοινότητα μας. Είναι πανεύκολο!

Δημιουργία νέου λογαριασμού

Σύνδεση

Έχετε ήδη λογαριασμό; Συνδεθείτε εδώ.

Συνδεθείτε τώρα
  • Δημιουργία νέου...