Προς το περιεχόμενο

Προτεινόμενες αναρτήσεις

Δημοσ.

Η Google ανακοίνωσε το νέο μοντέλο τεχνητής νοημοσύνης για παραγωγή βίντεο, Veo 2, ανοίγοντας λίστα αναμονής για τους ενδιαφερόμενους χρήστες.

Η Google προχώρησε στην παρουσίαση του νέου της μοντέλου τεχνητής νοημοσύνης για την παραγωγή βίντεο, με την ονομασία Veo 2, το οποίο αναμένεται να ανταγωνιστεί άμεσα το Sora της OpenAI στη μάχη για την κυριαρχία στον τομέα του AI video το 2025.

Σύμφωνα με την Google, το Veo 2 δημιουργεί "εξαιρετικά υψηλής ποιότητας βίντεο σε ένα ευρύ φάσμα θεμάτων και στυλ." Η εταιρεία τονίζει ιδιαίτερα την ικανότητα του Veo 2 να κατανοεί καλύτερα τη φυσική του πραγματικού κόσμου και τις λεπτομέρειες της ανθρώπινης κίνησης και έκφρασης.

Ένα σημαντικό πλεονέκτημα του Veo 2 έναντι του Sora της OpenAI είναι η δυνατότητα εξαγωγής βίντεο σε ανάλυση έως 4K, σε αντίθεση με το Sora Turbo που περιορίζεται στα 1080p για τους συνδρομητές του ChatGPT Plus.

image.png.e3ef89d9ccf80d49033068eb8f6e7c2c.png

Σύμφωνα με τα στοιχεία που παρουσίασε η Google, το Veo 2 ξεπέρασε τους ανταγωνιστές του σε δοκιμές όπου οι συμμετέχοντες αξιολόγησαν πάνω από 1.000 προτροπές και αντίστοιχα βίντεο στο MovieGenBench. Συγκεκριμένα, το 58,8% των συμμετεχόντων προτίμησε το Veo 2 έναντι του Sora Turbo, ενώ το 14,5% παρέμεινε ουδέτερο και το 26,7% προτίμησε το Sora Turbo.


Διαβάστε ολόκληρο το άρθρο

Δημοσ.

Δηλ αν το εννοησα καλως ,Ηθοποιοι , παρουσιαστριες πρωιναδικων , εκφωνητες ειδησεων ,sportscasters σελιγα χρονια θα

αποτελουν πλεονασμο .

  • Like 1
  • Thanks 1
Δημοσ.

Δεν έχω καταλάβει πως δημιουργούνται τα βίντεο. Είναι 3d γραφικά, είναι συνδυασμός υπαρκτών εικόνων - βίντεο; Δεν έχω καταλάβει πως λειτουργει.

Δημοσ.
5 hours ago, zio10 said:

Δεν έχω καταλάβει πως δημιουργούνται τα βίντεο. Είναι 3d γραφικά, είναι συνδυασμός υπαρκτών εικόνων - βίντεο; Δεν έχω καταλάβει πως λειτουργει.

Η βασική τεχνολογία που χρησιμοποιούν για να παράξουν video είναι τα μοντέλα diffusion. 

Εδώ το εξηγεί το ΑΙ με απλά λόγια:

Φανταστείτε ότι έχετε μια θολή εικόνα και θέλετε να την κάνετε καθαρή. Τα diffusion models λειτουργούν με μια παρόμοια λογική, αλλά αντίστροφα. Ξεκινούν με μια καθαρή εικόνα και σιγά σιγά προσθέτουν θόρυβο (noise), σαν να την θολώνουν όλο και περισσότερο, μέχρι που γίνεται εντελώς τυχαία. Αυτή η διαδικασία ονομάζεται "forward diffusion".

Στη συνέχεια, μαθαίνουν πώς να αφαιρέσουν τον θόρυβο βήμα-βήμα, αντιστρέφοντας τη διαδικασία, μέχρι να φτάσουν ξανά στην καθαρή εικόνα. Αυτή η αντίστροφη διαδικασία ονομάζεται "reverse diffusion".

Μόλις εκπαιδευτούν, τα diffusion models μπορούν να δημιουργήσουν νέες, ρεαλιστικές εικόνες. Ξεκινώντας από εντελώς τυχαίο θόρυβο, εφαρμόζουν την "reverse diffusion" για να τον μετατρέψουν σε μια εικόνα.

Με απλά λόγια, τα diffusion models μαθαίνουν πώς να μετατρέπουν τον θόρυβο σε εικόνες, αφαιρώντας τον σιγά σιγά.

Για να καταλάβετε καλύτερα, σκεφτείτε τα εξής:

Ζωγραφική: Σαν να ζωγραφίζετε μια εικόνα, ξεκινώντας από έναν λευκό καμβά (θόρυβο) και προσθέτοντας σιγά σιγά λεπτομέρειες, μέχρι να φτάσετε στο τελικό αποτέλεσμα.

Γλυπτική: Σαν να σκαλίζετε ένα γλυπτό, ξεκινώντας από ένα άμορφο κομμάτι μάρμαρο (θόρυβο) και αφαιρώντας σιγά σιγά υλικό, μέχρι να φτάσετε στο τελικό σχήμα.

Πού χρησιμεύουν;

Τα diffusion models έχουν πολλές εφαρμογές, όπως:

Δημιουργία εικόνων: Μπορούν να δημιουργήσουν ρεαλιστικές εικόνες από το μηδέν, ή να τροποποιήσουν υπάρχουσες εικόνες.

Βελτίωση εικόνων: Μπορούν να αφαιρέσουν θόρυβο από θολές ή κατεστραμμένες εικόνες.

Επεξεργασία βίντεο: Μπορούν να δημιουργήσουν ομαλές μεταβάσεις μεταξύ καρέ, ή να προσθέσουν ειδικά εφέ.

Δημιουργία μουσικής: Μπορούν να δημιουργήσουν νέα μουσικά κομμάτια.

Ιατρική απεικόνιση: Μπορούν να δημιουργήσουν ρεαλιστικές ιατρικές εικόνες, για εκπαιδευτικούς ή διαγνωστικούς σκοπούς.

Συνοπτικά:

Τα diffusion models είναι μια συναρπαστική τεχνολογία τεχνητής νοημοσύνης με πολλές δυνατότητες. Μαθαίνοντας πώς να αφαιρούν τον θόρυβο από τυχαία δεδομένα, μπορούν να δημιουργήσουν ρεαλιστικές εικόνες, βίντεο, μουσική και άλλα.

Δημοσ.

Ε εντάξει.  Τι Sora ... Εδώ μιλάμε για Google.  Έχουν να δουν τα μάτια μας απίστευτα πράγματα.  Τρομερή εξέλιξη.  Πλέον ο όρος " τι έχουμε να δούμε σε μερικά χρόνια" έχει κορεστεί.  Πλέον δεν ξέρουμε τι θα δούμε αύριο μεθαύριο.  Χαμός.  

Δημοσ. (επεξεργασμένο)
10 hours ago, Lucifer said:

εγώ κάτι για 60 κατ' ελάχιστον βλέπω

Σωστά, αλλά είδα υπάρχει και user community mod (η δύναμη του opensource!) που είναι για home pc. Εδώ το είδα (Συγνώμη που η ανάγνωση κειμένου μου είναι πολύ δυσκολότερη με το thumbnail)

 

Επεξ/σία από Athoz

Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε

Πρέπει να είστε μέλος για να αφήσετε σχόλιο

Δημιουργία λογαριασμού

Εγγραφείτε με νέο λογαριασμό στην κοινότητα μας. Είναι πανεύκολο!

Δημιουργία νέου λογαριασμού

Σύνδεση

Έχετε ήδη λογαριασμό; Συνδεθείτε εδώ.

Συνδεθείτε τώρα
  • Δημιουργία νέου...