Το Veo 2 της Google υπόσχεται ανώτερη ποιότητα βίντεο από το Sora

Crash24 · 18 Δεκεμβρίου 2024

Η Google ανακοίνωσε το νέο μοντέλο τεχνητής νοημοσύνης για παραγωγή βίντεο, Veo 2, ανοίγοντας λίστα αναμονής για τους ενδιαφερόμενους χρήστες.

Η Google προχώρησε στην παρουσίαση του νέου της μοντέλου τεχνητής νοημοσύνης για την παραγωγή βίντεο, με την ονομασία Veo 2, το οποίο αναμένεται να ανταγωνιστεί άμεσα το Sora της OpenAI στη μάχη για την κυριαρχία στον τομέα του AI video το 2025.

Σύμφωνα με την Google, το Veo 2 δημιουργεί "εξαιρετικά υψηλής ποιότητας βίντεο σε ένα ευρύ φάσμα θεμάτων και στυλ." Η εταιρεία τονίζει ιδιαίτερα την ικανότητα του Veo 2 να κατανοεί καλύτερα τη φυσική του πραγματικού κόσμου και τις λεπτομέρειες της ανθρώπινης κίνησης και έκφρασης.

Ένα σημαντικό πλεονέκτημα του Veo 2 έναντι του Sora της OpenAI είναι η δυνατότητα εξαγωγής βίντεο σε ανάλυση έως 4K, σε αντίθεση με το Sora Turbo που περιορίζεται στα 1080p για τους συνδρομητές του ChatGPT Plus.

Σύμφωνα με τα στοιχεία που παρουσίασε η Google, το Veo 2 ξεπέρασε τους ανταγωνιστές του σε δοκιμές όπου οι συμμετέχοντες αξιολόγησαν πάνω από 1.000 προτροπές και αντίστοιχα βίντεο στο MovieGenBench. Συγκεκριμένα, το 58,8% των συμμετεχόντων προτίμησε το Veo 2 έναντι του Sora Turbo, ενώ το 14,5% παρέμεινε ουδέτερο και το 26,7% προτίμησε το Sora Turbo.

Διαβάστε ολόκληρο το άρθρο

thomasG4 · 18 Δεκεμβρίου 2024

H διαφορά Google με OpenAI είναι χαώδης:

Επίσης:

Επεξ/σία 18 Δεκεμβρίου 2024 από thomasG4

Innersense · 18 Δεκεμβρίου 2024

Δεν δέχεται ούτε μέσω VPN εγγραφή για να το δούμε ε;

nepomuk · 18 Δεκεμβρίου 2024

Δηλ αν το εννοησα καλως ,Ηθοποιοι , παρουσιαστριες πρωιναδικων , εκφωνητες ειδησεων ,sportscasters σελιγα χρονια θα

αποτελουν πλεονασμο .

Athoz · 18 Δεκεμβρίου 2024

Ναι αλλά το HunyuanVideo είναι uncensored (wink wink) και opensource (τρέχει ακόμη και σε 12GB vram gpu στο pc μας ή και σε service με 0.69$ το βίντεο).

vste · 18 Δεκεμβρίου 2024

Εμενα μπορει να μου πει κανεις με ποια ΑΙ εχει γινει αυτο το video?

Vasilisxd · 18 Δεκεμβρίου 2024

Έλα μωρέ, η φούσκα της Ai όπου να ναι θα σκάσει, τι κάθεστε και ασχολείστε και εσείς.

zio10 · 18 Δεκεμβρίου 2024

Δεν έχω καταλάβει πως δημιουργούνται τα βίντεο. Είναι 3d γραφικά, είναι συνδυασμός υπαρκτών εικόνων - βίντεο; Δεν έχω καταλάβει πως λειτουργει.

thomasG4 · 18 Δεκεμβρίου 2024

5 hours ago, zio10 said:

Δεν έχω καταλάβει πως δημιουργούνται τα βίντεο. Είναι 3d γραφικά, είναι συνδυασμός υπαρκτών εικόνων - βίντεο; Δεν έχω καταλάβει πως λειτουργει.

Η βασική τεχνολογία που χρησιμοποιούν για να παράξουν video είναι τα μοντέλα diffusion.

Εδώ το εξηγεί το ΑΙ με απλά λόγια:

Φανταστείτε ότι έχετε μια θολή εικόνα και θέλετε να την κάνετε καθαρή. Τα diffusion models λειτουργούν με μια παρόμοια λογική, αλλά αντίστροφα. Ξεκινούν με μια καθαρή εικόνα και σιγά σιγά προσθέτουν θόρυβο (noise), σαν να την θολώνουν όλο και περισσότερο, μέχρι που γίνεται εντελώς τυχαία. Αυτή η διαδικασία ονομάζεται "forward diffusion".

Στη συνέχεια, μαθαίνουν πώς να αφαιρέσουν τον θόρυβο βήμα-βήμα, αντιστρέφοντας τη διαδικασία, μέχρι να φτάσουν ξανά στην καθαρή εικόνα. Αυτή η αντίστροφη διαδικασία ονομάζεται "reverse diffusion".

Μόλις εκπαιδευτούν, τα diffusion models μπορούν να δημιουργήσουν νέες, ρεαλιστικές εικόνες. Ξεκινώντας από εντελώς τυχαίο θόρυβο, εφαρμόζουν την "reverse diffusion" για να τον μετατρέψουν σε μια εικόνα.

Με απλά λόγια, τα diffusion models μαθαίνουν πώς να μετατρέπουν τον θόρυβο σε εικόνες, αφαιρώντας τον σιγά σιγά.

Για να καταλάβετε καλύτερα, σκεφτείτε τα εξής:

Ζωγραφική: Σαν να ζωγραφίζετε μια εικόνα, ξεκινώντας από έναν λευκό καμβά (θόρυβο) και προσθέτοντας σιγά σιγά λεπτομέρειες, μέχρι να φτάσετε στο τελικό αποτέλεσμα.

Γλυπτική: Σαν να σκαλίζετε ένα γλυπτό, ξεκινώντας από ένα άμορφο κομμάτι μάρμαρο (θόρυβο) και αφαιρώντας σιγά σιγά υλικό, μέχρι να φτάσετε στο τελικό σχήμα.

Πού χρησιμεύουν;

Τα diffusion models έχουν πολλές εφαρμογές, όπως:

Δημιουργία εικόνων: Μπορούν να δημιουργήσουν ρεαλιστικές εικόνες από το μηδέν, ή να τροποποιήσουν υπάρχουσες εικόνες.

Βελτίωση εικόνων: Μπορούν να αφαιρέσουν θόρυβο από θολές ή κατεστραμμένες εικόνες.

Επεξεργασία βίντεο: Μπορούν να δημιουργήσουν ομαλές μεταβάσεις μεταξύ καρέ, ή να προσθέσουν ειδικά εφέ.

Δημιουργία μουσικής: Μπορούν να δημιουργήσουν νέα μουσικά κομμάτια.

Ιατρική απεικόνιση: Μπορούν να δημιουργήσουν ρεαλιστικές ιατρικές εικόνες, για εκπαιδευτικούς ή διαγνωστικούς σκοπούς.

Συνοπτικά:

Τα diffusion models είναι μια συναρπαστική τεχνολογία τεχνητής νοημοσύνης με πολλές δυνατότητες. Μαθαίνοντας πώς να αφαιρούν τον θόρυβο από τυχαία δεδομένα, μπορούν να δημιουργήσουν ρεαλιστικές εικόνες, βίντεο, μουσική και άλλα.

Diavolos666 · 19 Δεκεμβρίου 2024

Η google έχει και το πλεονέκτημα ότι της ανήκει το youtube οπότε έχει το μεγαλύτερο υλικό για εκπαίδευση βίντεο από όλους.

Lucifer · 19 Δεκεμβρίου 2024

14 ώρες πριν, Athoz είπε

τρέχει ακόμη και σε 12GB vram gpu στο pc μας

εγώ κάτι για 60 κατ' ελάχιστον βλέπω

georgiosmag · 19 Δεκεμβρίου 2024

Ε εντάξει. Τι Sora ... Εδώ μιλάμε για Google. Έχουν να δουν τα μάτια μας απίστευτα πράγματα. Τρομερή εξέλιξη. Πλέον ο όρος " τι έχουμε να δούμε σε μερικά χρόνια" έχει κορεστεί. Πλέον δεν ξέρουμε τι θα δούμε αύριο μεθαύριο. Χαμός.

Athoz · 19 Δεκεμβρίου 2024

10 hours ago, Lucifer said:

εγώ κάτι για 60 κατ' ελάχιστον βλέπω

Σωστά, αλλά είδα υπάρχει και user community mod (η δύναμη του opensource!) που είναι για home pc. Εδώ το είδα (Συγνώμη που η ανάγνωση κειμένου μου είναι πολύ δυσκολότερη με το thumbnail)

Επεξ/σία 19 Δεκεμβρίου 2024 από Athoz

Σύνδεση

Το Veo 2 της Google υπόσχεται ανώτερη ποιότητα βίντεο από το Sora

Προτεινόμενες αναρτήσεις

Crash24

thomasG4

Innersense

nepomuk

Athoz

vste

Vasilisxd

zio10

thomasG4

Diavolos666

Lucifer

georgiosmag

Athoz

Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε

Δημιουργία λογαριασμού

Σύνδεση

Σύνδεση