Για μία ακόμη φορά ένα tech demo δημιουργεί αμφιβολίες για την εγκυρότητα αυτών των επιδείξεων.

Είναι σοφό το ρητό, τα φαινόμενα απατούν.

Το Φεβρουάριο, η OpenAI, δημιουργός του ChatGPT, παρουσίασε το Sora, ένα νέο μοντέλο τεχνητής νοημοσύνης για τη μετατροπή κειμένου σε βίντεο. Παρότι το Sora δεν είναι ακόμη διαθέσιμο σε όλους, η ανακοίνωση στέφθηκε από επιτυχία, με το νέο προϊόν να προκαλεί αίσθηση στην αγορά, ενώ τα διάφορα σύντομα βίντεο που φέρονταν να έχουν δημιουργηθεί με το Sora συγκέντρωσαν μεγάλο ενδιαφέρον.

Όμως, τουλάχιστον ένα από εκείνα τα βίντεο, διάρκειας περίπου δύο λεπτών, με τίτλο "Air Head" -το οποίο ήταν τόσο εντυπωσιακό ώστε ήταν η κεντρική εικόνα στο τότε άρθρο- είχε κάπως περισσότερες ανθρώπινες παρεμβάσεις, από ό,τι άφησε να εννοηθεί η OpenAI.

Σύμφωνα με δηλώσεις του Πάτρικ Σέντερμπεργκ, διευθυντή δημιουργικού στη Shy Kids, το στούντιο που δημιούργησε το βίντεο, το "Air Head" χρειάστηκε αρκετές τροποποιήσεις και επεξεργασία ώστε να προκύψει το τελικό, εντυπωσιακό αποτέλεσμα: πρόκειται για σημαντική πληροφορία, με δεδομένο ότι η OpenAI παρουσίασε το βίντεο χωρίς την παραμικρή αναφορά στην επιπρόσθετη επεξεργασία που απαιτήθηκε.

Όπως ανέφερε ο Σέντερμπεργκ, η δημιουργία του βίντεο δεν ήταν τόσο απλή όσο το να εισάγουν μια περιγραφή και να πατήσουν ένα πλήκτρο. Σε ορισμένες περιπτώσεις το Sora απέδιδε τον κεντρικό χαρακτήρα με επιεικώς ανατριχιαστικό τρόπο, τοποθετώντας πάνω στο μπαλόνι ένα ανθρώπινο πρόσωπο, σαν σκηνή από ταινία τρόμου. Άλλες φορές, το Sora άλλαζε χρώμα στο μπαλόνι, ενώ σε ορισμένες σκηνές το στούντιο χρειάστηκε να απομονώσει και να αλλάξει χρώμα στο μπαλόνι, χρησιμοποιώντας το Adobe After Effects.

Αυτό συνέβη κυρίως σε μια σκηνή όπου ο κεντρικός χαρακτήρας, ονόματι Σάνι, κυνηγάει το αιωρούμενο κεφάλι του σε μια πλατεία. Αρχικά, το μπαλόνι είχε αποδοθεί κόκκινο, όχι κίτρινο. Στην ίδια σκηνή η Shy Kids χρειάστηκε να αφαιρέσει ορισμένα ανεπιθύμητα στοιχεία, ανάμεσά τους και ένα κεφάλι που παρέπεμπέ σε κούκλα βιτρίνας, που το Sora είχ επροσθέσει στο ανθρώπινο σώμα του Σάνι.

Η ταχύτητα ήταν επίσης ένα ζήτημα. Το Sora τείνει να δημιουργεί βίντεο σε στυλ αργής κίνησης, ανέφερε ο Σέντερμπεργκ και το να προκύψει ένα τελικό αποτέλεσμα με κίνηση που να παραπέμπει σε ταινία ή βίντεο κλιπ φαίνεται πως κάθε άλλο παρά απλό ήταν.

Συνολικά, πάντως, ο Σέντερμπεργκ χαρακτήρισε ενδιαφέρουσα εμπειρία την ευκαιρία να πειραματιστούν με το Sora.

"Είναι ένα πολύ, μα πολύ ισχυρό εργαλείο", σχολίασε, "κι ήδη σκεφτόμαστε ένα σωρό τρόπους που θα μπορούσαμε να το ενσωματώσουμε στις υφιστάμενες διαδικασίες μας".

Όμως, όπως και άλλα μοντέλα τεχνητής νοημοσύνης, το Sora παραμένει απρόβλεπτο και, προφανώς, εξακολουθεί να έχει αδυναμίες. Ο ίδιος ο Σέντερμπεργκ θεωρεί πως ο έλεγχος του αποτελέσματος παραμένει το πλέον επιθυμητό στοιχείο που όμως, για την ώρα, αποδεικνύεται ανέφικτο.

Και μπορεί η OpenAI να θέλει να δημιουργήσει την εντύπωση πως τα πράγματα βρίσκονται σε πολύ πιο προχωρημένο στάδιο, όμως φαίνεται ότι το Sora απέχει ακόμη πολύ έως ότου να είναι έτοιμο να δημιουργήσει επαγγελματικής ποιότητας βίντεο κλιπ, χωρίς μια γενναία δόση ανθρώπινης παρέμβασης.

Πράγμα το οποίο, για όσους ανησυχούν για τη ραγδαία εξέλιξη της τεχνητής νοημοσύνης, δεν είναι απαραίτητα αρνητικό.

  • Like 3