Προς το περιεχόμενο

Προτεινόμενες αναρτήσεις

  • Super Moderators
Δημοσ.

Για μία ακόμη φορά ένα tech demo δημιουργεί αμφιβολίες για την εγκυρότητα αυτών των επιδείξεων.

Είναι σοφό το ρητό, τα φαινόμενα απατούν.

Το Φεβρουάριο, η OpenAI, δημιουργός του ChatGPT, παρουσίασε το Sora, ένα νέο μοντέλο τεχνητής νοημοσύνης για τη μετατροπή κειμένου σε βίντεο. Παρότι το Sora δεν είναι ακόμη διαθέσιμο σε όλους, η ανακοίνωση στέφθηκε από επιτυχία, με το νέο προϊόν να προκαλεί αίσθηση στην αγορά, ενώ τα διάφορα σύντομα βίντεο που φέρονταν να έχουν δημιουργηθεί με το Sora συγκέντρωσαν μεγάλο ενδιαφέρον.

Όμως, τουλάχιστον ένα από εκείνα τα βίντεο, διάρκειας περίπου δύο λεπτών, με τίτλο "Air Head" -το οποίο ήταν τόσο εντυπωσιακό ώστε ήταν η κεντρική εικόνα στο τότε άρθρο- είχε κάπως περισσότερες ανθρώπινες παρεμβάσεις, από ό,τι άφησε να εννοηθεί η OpenAI.

Σύμφωνα με δηλώσεις του Πάτρικ Σέντερμπεργκ, διευθυντή δημιουργικού στη Shy Kids, το στούντιο που δημιούργησε το βίντεο, το "Air Head" χρειάστηκε αρκετές τροποποιήσεις και επεξεργασία ώστε να προκύψει το τελικό, εντυπωσιακό αποτέλεσμα: πρόκειται για σημαντική πληροφορία, με δεδομένο ότι η OpenAI παρουσίασε το βίντεο χωρίς την παραμικρή αναφορά στην επιπρόσθετη επεξεργασία που απαιτήθηκε.

Όπως ανέφερε ο Σέντερμπεργκ, η δημιουργία του βίντεο δεν ήταν τόσο απλή όσο το να εισάγουν μια περιγραφή και να πατήσουν ένα πλήκτρο. Σε ορισμένες περιπτώσεις το Sora απέδιδε τον κεντρικό χαρακτήρα με επιεικώς ανατριχιαστικό τρόπο, τοποθετώντας πάνω στο μπαλόνι ένα ανθρώπινο πρόσωπο, σαν σκηνή από ταινία τρόμου. Άλλες φορές, το Sora άλλαζε χρώμα στο μπαλόνι, ενώ σε ορισμένες σκηνές το στούντιο χρειάστηκε να απομονώσει και να αλλάξει χρώμα στο μπαλόνι, χρησιμοποιώντας το Adobe After Effects.

Αυτό συνέβη κυρίως σε μια σκηνή όπου ο κεντρικός χαρακτήρας, ονόματι Σάνι, κυνηγάει το αιωρούμενο κεφάλι του σε μια πλατεία. Αρχικά, το μπαλόνι είχε αποδοθεί κόκκινο, όχι κίτρινο. Στην ίδια σκηνή η Shy Kids χρειάστηκε να αφαιρέσει ορισμένα ανεπιθύμητα στοιχεία, ανάμεσά τους και ένα κεφάλι που παρέπεμπέ σε κούκλα βιτρίνας, που το Sora είχ επροσθέσει στο ανθρώπινο σώμα του Σάνι.

Η ταχύτητα ήταν επίσης ένα ζήτημα. Το Sora τείνει να δημιουργεί βίντεο σε στυλ αργής κίνησης, ανέφερε ο Σέντερμπεργκ και το να προκύψει ένα τελικό αποτέλεσμα με κίνηση που να παραπέμπει σε ταινία ή βίντεο κλιπ φαίνεται πως κάθε άλλο παρά απλό ήταν.

Συνολικά, πάντως, ο Σέντερμπεργκ χαρακτήρισε ενδιαφέρουσα εμπειρία την ευκαιρία να πειραματιστούν με το Sora.

"Είναι ένα πολύ, μα πολύ ισχυρό εργαλείο", σχολίασε, "κι ήδη σκεφτόμαστε ένα σωρό τρόπους που θα μπορούσαμε να το ενσωματώσουμε στις υφιστάμενες διαδικασίες μας".

Όμως, όπως και άλλα μοντέλα τεχνητής νοημοσύνης, το Sora παραμένει απρόβλεπτο και, προφανώς, εξακολουθεί να έχει αδυναμίες. Ο ίδιος ο Σέντερμπεργκ θεωρεί πως ο έλεγχος του αποτελέσματος παραμένει το πλέον επιθυμητό στοιχείο που όμως, για την ώρα, αποδεικνύεται ανέφικτο.

Και μπορεί η OpenAI να θέλει να δημιουργήσει την εντύπωση πως τα πράγματα βρίσκονται σε πολύ πιο προχωρημένο στάδιο, όμως φαίνεται ότι το Sora απέχει ακόμη πολύ έως ότου να είναι έτοιμο να δημιουργήσει επαγγελματικής ποιότητας βίντεο κλιπ, χωρίς μια γενναία δόση ανθρώπινης παρέμβασης.

Πράγμα το οποίο, για όσους ανησυχούν για τη ραγδαία εξέλιξη της τεχνητής νοημοσύνης, δεν είναι απαραίτητα αρνητικό.


Διαβάστε ολόκληρο το άρθρο

Δημοσ.
2 ώρες πριν, herbalife3 είπε

Με ένα κεφάλι γεμάτο χρυσάφι...

Πω πω, και εμένα Τρύπες μου θύμισε μόλις το διάβασα.

  • Like 1
Δημοσ.

Άλλο και τούτο, εάν το έκανε το βίντεο ο Παναής δεν θα το δει κανείς, εάν όμως το έκανε ο παν ΑΙ ς θα το δούν εκατομμύρια, καλή πρακτική.   

  • Like 1
  • Haha 1
Δημοσ.
Αναφορά σε κείμενο

Clips can be rendered in varying segments of time, such as 3 secs, 5 sec, 10 sec, 20sec, up to a minute. Render times vary depending on the time of day and the demand for cloud usage. “Generally, you’re looking at about 10 to 20 minutes per render,” Patrick recalls. “From my experience, the duration that I choose to render has a small effect on the render time. If it’s 3 to 20 seconds, the render time tends not to vary too much from between a 10 to 20-minute range. We would generally do that because if you get the full 20 seconds, you hope you have more opportunities to slice/edit stuff out and increase your chances of getting something that looks good.”

For the minute and a half of footage that ended up in the film, Patrick estimated that they generated “hundreds of generations at 10 to 20 seconds a piece”. Adding, “My math is bad, but I would guess probably 300:1 in terms of the amount of source material to what ended up in the final.”

sauce

Για αυτή την μπούρδα αυτό το καλλιτεχνικό αριστούργημα των 81 δευτερολέπτων δαπανήθηκαν περίπου 800-1600 υπολογιστικές ώρες σε SotA hardware + post processing. :lol: 

Ήξερα ότι κάτι παίζει αλλά τα πράγματα είναι πολύ πιο τραγικά από όσο νόμιζα, παρότι ήμουν από τους πιο επιφυλακτικούς σχετικά με το SORA.

  • Like 1
Δημοσ.

Δεν θα το έλεγα και το

"εντυπωσιακό βίντεο"

 Είπαμε να τα φουσκώνουμε αλλά όχι τόσο.

 

  • Thanks 1
Δημοσ. (επεξεργασμένο)

Πλέον οι τεχνολογικές εταιρίες είναι εργοστάσια παραγωγής χαιπ για το φούσκωμα της χρηματιστηριακής αξίας τους, η παραγωγή χρήσιμων προϊόντων αρχίζει να μπαίνει σε δεύτερη μοίρα.

O αρρύθμιστος καπιταλισμός, δεν είναι παραγωγικός καπιταλισμός.

Επεξ/σία από Evangelos Anagnostou
  • Like 3
Δημοσ.

Μας έχουν ζαλίσει τον έρωτα,για να μην πω τπτ άλλο, με το μάρκετινγκ του ΑΙ και τους δημοσιογράφους που βρήκαν θέμα για να τρομάξουν τον κόσμο και να τσιμπάνε κλικς.

Είμαστε ακόμα πολυυυυ μακριά από μια πραγματική ΑΙ, ίσως στην εποχή των κβαντουπολογιστων....

Για την ώρα έξυπνη αλγόριθμοι που δίνουν μια αίσθηση νοημοσύνης και που από πίσω χρειάζονται συνεχώς ανθρώπινη υποστήριξη.

Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε

Πρέπει να είστε μέλος για να αφήσετε σχόλιο

Δημιουργία λογαριασμού

Εγγραφείτε με νέο λογαριασμό στην κοινότητα μας. Είναι πανεύκολο!

Δημιουργία νέου λογαριασμού

Σύνδεση

Έχετε ήδη λογαριασμό; Συνδεθείτε εδώ.

Συνδεθείτε τώρα
  • Δημιουργία νέου...