nchatz Δημοσ. 30 Μαρτίου Δημοσ. 30 Μαρτίου Το μοντέλο, με την επωνυμία Voice Generation, αναπτύσσεται από τα τέλη του 2022 και είναι αυτό πάνω στο οποίο βασίζεται η λειτουργία ανάγνωσης που διαθέτει το ChatGPT. Η OpenAI προσφέρει περιορισμένη πρόσβαση σε μια πλατφόρμα μετατροπής κειμένου σε φωνή την οποία έχει αναπτύξει, με την επωνυμία Voice Engine, η οποία μπορεί να δημιουργήσει συνθετική φωνή, βασισμένη σε ηχογραφημένο απόσπασμα διάρκειας μόλις 15 δευτερολέπτων. Η φωνή αυτή είναι σε θέση να αναγνώσει γραπτές οδηγίες στην ίδια γλώσσα όπως ο πραγματικός ομιλητής ή σε μια σειρά από άλλες γλώσσες. "Αυτές οι μικρής κλίμακας εφαρμογές μας βοηθούν να καταλήξουμε στην προσέγγιση, τις ασφαλιστικές δικλείδες και στον τρόπο που αντιλαμβανόμαστε το πώς θα μπορούσε να χρησιμοποιηθεί η Voice Engine για καλούς σκόπους, σε μια σειρά τομέων", αναφέρει η OpenAI σε ανάρτηση στο ιστολόγιό της. Μεταξύ των εταιριών που έχουν πρόσβαση στην πλατφόρμα συγκαταλέγεται και εταιρία εκπαιδευτικής τεχνολογίας Age of Learning, η πλατφόρμα μυθοπλασίας HeyGen, η πρωτοπόρος στον τομέα του λογισμικού για εφαρμογές υγείας Dimagi, η Livox που δημιουργεί εφαρμογές επικοινωνίας με τη χρήση τεχνητής νοημοσύνης, καθώς και η Lifespan, η οποία αναπτύσσει συστήματα υγείας. Στα παρακάτω δείγματα, τα οποία δημοσίευσε η OpenAI, μπορεί κανείς να διαπιστώσει πώς αξιοποιεί η Age of Learning την τεχνολογία αυτή προκειμένου να δημιουργήσει εκφωνήσεις προεπιλεγμένου υλικού αλλά και για την ανάγνωση "προσωποποιημένων απαντήσεων σε πραγματικό χρόνο", γραμμένες από το GPT-4. Πρώτα, το ηχητικό απόσπασμα στα Αγγλικά, που αποτελεί τη βάση: age_of_learning_reference.mp3 Κι εδώ, έχουμε τα τρία ηχητικά αποσπάσματα που δημιουργήθηκαν από την τεχνητή νοημοσύνη, βασισμένα στο παραπάνω δείγμα: age_of_learning_rainforest.mp3 age_of_learning_reading.mp3 age_of_learning_chemistry.mp3 Η OpenAI ανέφερε πως ξεκίνησε την ανάπτυξη της Voice Engine το 2022 και ότι η τεχνολογία αυτή έχει υποστηρίξει ήδη φωνές που χρησιμοποιούνται στη μετατροπή κειμένου σε φωνή, καθώς και τη λειτουργία Read Aloud που διαθέτει το ChatGPT. Σε συνέντευξη που παραχώρησε το TechCrunch, ο Τζεφ Χάρις, μέλος της ομάδας ανάπτυξης της Voice Engine, ανέφερε ότι το μοντέλο εκπαιδεύτηκε χρησιμοποιώντας "συνδυασμό δημόσια διαθέσιμων δεδομένων και νόμιμα παραχωρημένου υλικού". Η OpenAI δήλωσε ότι το μοντέλο θα διατεθεί αρχικά σε περίπου 10 εταιρίες. Η μετατροπή κειμένου σε ήχο μέσω τεχνητής νοημοσύνης αποτελεί έναν τομέα της συγκεκριμένης τεχνολογίας που εξακολουθεί να εξελίσσεται. Παρότι το ενδιαφέρον εστιάζεται κυρίως σε ορχηστρικούς ή φυσικούς ήχους, έχουν καταγραφεί προσπάθειες και στο κομμάτι της δημιουργίας φωνής, αλλά σε πολύ μικρότερο βαθμό, εν μέρει λόγω των ζητημάτων που έθεσε η ίδια η OpenAI, ως προς το πώς θα χρησιμοποιούταν αυτό το υλικό. Την ίδια στιγμή, η αμερικανική κυβέρνηση επιχειρεί να περιορίσει την κακόβουλη χρήση της τεχνολογίας δημιουργίας φωνής μέσω τεχνητής νοημοσύνης. Μόλις τον περασμένο μήνα, η Ομοσπονδιακή Επιτροπή Επικοινωνιών απαγόρευσε τις αυτόματες κλήσεις με τη χρήση φωνών που δημιουργήθηκαν από μοντέλα τεχνητής νοημοσύνης, μετά από καταγγελίες ότι πολίτες δέχονταν τηλεφωνήματα όπου χρησιμοποιούνταν η κλωνοποιημένη φωνή του προέδρου Μπάιντεν, με τα οποία καλούνταν οι ψηφοφόροι να μην προσέλθουν στις εκλογές. Σύμφωνα με την OpenAI, οι εταίροι της συμφώνησαν να τηρήσουν το πλαίσιο χρήσης που διαμόρφωσε η εταιρία και ορίζει πως το υλικό δεν θα χρησιμοποιείται για την προώθηση μηνυμάτων από άτομα ή οργανισμούς χωρίς την πρότερη συγκατάθεσή τους. Παράλληλα, οι εταίροι υποχρεούνται να λάβουν τη "ρητή και ενήμερη συναίνεση" του αρχικού ομιλητή, να μη δημιουργήσουν τρόπους ώστε οι χρήστες να μπορούν να σχηματίζουν δικές τους φωνές και να ενημερώνουν τους ακροατές ότι οι φωνές που ακούγονται έχουν δημιουργηθεί από πρόγραμμα τεχνητής νοημοσύνης. Η OpenAI προσέθεσε επίσης την ενσωμάτων υδατογραφημάτων στα ηχητικά αποσπάσματα ώστε να εντοπίζεται η αρχική προέλευσή τους και να παρακολουθείται ενεργά το πού χρησιμοποιείται το υλικό. Η OpenAI πρότεινε διάφορα βήματα που θεωρεί πως θα μπορούσαν να περιορίσουν τους κινδύνους γύρω από τέτοιου είδους εργαλεία, μεταξύ των οποίων τη σταδιακή αφαίρεση της φωνητικής πρόσβασης σε τραπεζικούς λογαριασμούς, πολιτικές για την προστασία της χρήσης της φωνής των ανθρώπων σε μοντέλα τεχνητής νοημοσύνης, διεξοδικότερη ενημέρωση για την κακόβουλη χρήση της τεχνητής νοημοσύνης και την ανάπτυξη συστημάτων παρακολούθησης του πού χρησιμοποιείται το περιεχόμενο που έχει δημιουργηθεί από μοντέλα τεχνητής νοημοσύνης. Διαβάστε ολόκληρο το άρθρο
Pokemon640 Δημοσ. 1 Απριλίου Δημοσ. 1 Απριλίου (επεξεργασμένο) -Κύριε πρόεδρε, δεν μπορώ να έρθω στην ομιλία λόγω κρυολογήματος, θα φέρω το ρομπότ μου να διαβάσει το δελτίο τύπου για το επιστημονικό συνέδριο. -Αίτημα δεκτό, καλή ξεκούραση! 😁 Επεξ/σία 1 Απριλίου από Pokemon640 1
Shyn Δημοσ. 1 Απριλίου Δημοσ. 1 Απριλίου (επεξεργασμένο) Υπάρχει ήδη ΑΙ ανοιχτού κώδικα που μπορεί να μιμηθεί φωνές καθώς και μετατροπή από κείμενο Επεξ/σία 1 Απριλίου από Shyn
Macosj Δημοσ. 1 Απριλίου Δημοσ. 1 Απριλίου (επεξεργασμένο) τώρα πραγματικά θα κάνουν πάρτι αυτοί που εξαπατουν τους ηλικιωμένους με τροχαία, φόνους κτλ των παιδιών τους. Με τη φωνή τους, θα ρίχνουν πιο εύκολα τα χιλιάρικα από το μπαλκόνι Επεξ/σία 1 Απριλίου από Macosj 2 1 1 1
fanisatt Δημοσ. 1 Απριλίου Δημοσ. 1 Απριλίου Επίτευγμα...!! Η τεχνολογία είναι καλή , αν όχι ουδέτερη ! Οι άνθρωποι είμαστε επικίνδυνοι..... 2
SoullessRider Δημοσ. 1 Απριλίου Δημοσ. 1 Απριλίου (επεξεργασμένο) θα πρέπει - πιστεύω - για το καλό όλων να περάσει ένας παγκόσμιος νόμος, με τον οποίο κάθε τι που παράγεται από ai να έχει ένα σταμπάρισμα ως "ai generated"... όχι απλά στα μεταδεδομένα / info του αρχικού, αλλά και στο ίδιο το παραγόμενο "προϊόν" / "έργο" (πχ υδατογράφημα σε φωτό και βίντεο).... Και αν περάσει με κάποιο τρόπο και περιορισμός στα εργαλεία περικοπής / θαμπώματος κλπ των εφαρμογών με τις οποίες μπορεί να επεξεργαστεί κάποιος τα έργα αυτά, ώστε να μην επιτρέπουν κάτι τέτοιο θα ήταν το καλύτερο Θα μας γλιτώσει από πολύ ψέμα, πολύ προπαγάνδα, πολύ τρέξιμο.... Αν δούμε τα social που έχουν γεμίσει με ai εικόνες και fake news "σέξι γκόμενες" κλπ "φωτογραφίες στο θιβέτ / φαρ ουέστ με μοναχούς / καουμπόιδες και εξωγήινους" "κρανία / σκελετούς από μονόκερους, κύκλωπες, γίγαντες (όχι τους γιαχνί), που ανακαλύφθηκαν αλλά τα κρύβουν" και χορούς και τραγούδια από Κούληδες, Αλέξηδες και Κασελάκηδες.... οι εξωγήινοι και οι σκελετοί έχουν πάρει πάλι τα πάνω τους τελευταία.... Επεξ/σία 1 Απριλίου από SoullessRider 5 1 1
johnnycer Δημοσ. 1 Απριλίου Δημοσ. 1 Απριλίου 4 ώρες πριν, Shyn είπε Υπάρχει ήδη ΑΙ ανοιχτού κώδικα που μπορεί να μιμηθεί φωνές καθώς και μετατροπή από κείμενο Κάποιο git/όνομα εφαρμογής για να τσεκαρουμε; 1
Shyn Δημοσ. 1 Απριλίου Δημοσ. 1 Απριλίου 1 minute ago, johnnycer said: Κάποιο git/όνομα εφαρμογής για να τσεκαρουμε; Github: asonppy/VoiceCraft
oldnew Δημοσ. 1 Απριλίου Δημοσ. 1 Απριλίου 32 minutes ago, Shyn said: Github: asonppy/VoiceCraft Ωραία.. Θα φτιάξω τον κιττ απ τον ιππότη της ασφάλτου να μιλάει ελληνικά.. 2
KilliK Δημοσ. 2 Απριλίου Δημοσ. 2 Απριλίου 16 λεπτά πριν, oldnew είπε Ωραία.. Θα φτιάξω τον κιττ απ τον ιππότη της ασφάλτου να μιλάει ελληνικά.. υπαρχει ηδη 8
zodiacskipper Δημοσ. 2 Απριλίου Δημοσ. 2 Απριλίου Δεν θα ξέρουμε σε λίγο τι είναι αληθινό και τι AI generated
liakjim Δημοσ. 2 Απριλίου Δημοσ. 2 Απριλίου 10 ώρες πριν, SoullessRider είπε θα πρέπει - πιστεύω - για το καλό όλων να περάσει ένας παγκόσμιος νόμος, με τον οποίο κάθε τι που παράγεται από ai να έχει ένα σταμπάρισμα ως "ai generated"... όχι απλά στα μεταδεδομένα / info του αρχικού, αλλά και στο ίδιο το παραγόμενο "προϊόν" / "έργο" (πχ υδατογράφημα σε φωτό και βίντεο).... Και αν περάσει με κάποιο τρόπο και περιορισμός στα εργαλεία περικοπής / θαμπώματος κλπ των εφαρμογών με τις οποίες μπορεί να επεξεργαστεί κάποιος τα έργα αυτά, ώστε να μην επιτρέπουν κάτι τέτοιο θα ήταν το καλύτερο Θα μας γλιτώσει από πολύ ψέμα, πολύ προπαγάνδα, πολύ τρέξιμο.... Αν δούμε τα social που έχουν γεμίσει με ai εικόνες και fake news "σέξι γκόμενες" κλπ "φωτογραφίες στο θιβέτ / φαρ ουέστ με μοναχούς / καουμπόιδες και εξωγήινους" "κρανία / σκελετούς από μονόκερους, κύκλωπες, γίγαντες (όχι τους γιαχνί), που ανακαλύφθηκαν αλλά τα κρύβουν" και χορούς και τραγούδια από Κούληδες, Αλέξηδες και Κασελάκηδες.... οι εξωγήινοι και οι σκελετοί έχουν πάρει πάλι τα πάνω τους τελευταία.... 1 1
golity Δημοσ. 2 Απριλίου Δημοσ. 2 Απριλίου Στο μέλλον βλέπω να έχει τη δυνατότητα κάποιος να παρακολουθεί μια ταινία η οποία θα έχει φτιαχτεί εξολοκλήρου από ΑΙ, τη στιγμή που θα τη ζητήσει. «Φτιάξε μου μια ταινία δράσης, διαρκείας 1 ώρας και 30 λεπτών, με τους Χ ηθοποιούς ως πρωταγωνιστές, με το τάδε σενάριο ή να αυτοσχεδιάσεις» Πολλοι θα χάσουν τις δουλειές τους
Προτεινόμενες αναρτήσεις
Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε
Πρέπει να είστε μέλος για να αφήσετε σχόλιο
Δημιουργία λογαριασμού
Εγγραφείτε με νέο λογαριασμό στην κοινότητα μας. Είναι πανεύκολο!
Δημιουργία νέου λογαριασμούΣύνδεση
Έχετε ήδη λογαριασμό; Συνδεθείτε εδώ.
Συνδεθείτε τώρα