Προς το περιεχόμενο

Προτεινόμενες αναρτήσεις

Δημοσ.

Ερευνητές στο Πανεπιστήμιο της Ουάσιγκτον ανέπτυξαν σύστημα τεχνητής νοημοσύνης που "κλειδώνει" σε συγκεκριμένο άτομο, μέσα σε ελάχιστη ώρα.

Τα ακουστικά ακύρωσης θορύβου έχουν εξελιχτεί πολύ στο να δημιουργούν ένα φιλικότερο ηχητικό περιβάλλον για το χρήστη, αποκλείοντας τη συντριπτική πλειοψηφία των ήχων. Όμως, το να επιτρέπουν σε συγκεκριμένους ήχους από το περιβάλλον να περνούν από το τείχος αυτό εξακολουθεί να συνιστά πρόκληση για τους ερευνητές. Η νέα έκδοση των AirPods Pro της Apple, λόγου χάρη, ρυθμίζει αυτόματα τα επίπεδα του ήχου -έχοντας τη δυνατότητα να αντιληφθεί πότε συνομιλείτε, λόγου χάρη- όμως ο χρήστης έχει ελάχιστο έλεγχο πάνω στο ποιον θέλουν να ακούσουν ή πότε συμβαίνει αυτό.

Ομάδα ερευνητών του Πανεπιστημίου της Ουάσιγκτον ανέπτυξε σύστημα τεχνητής νοημοσύνης το οποίο επιτρέπει σε χρήστη που φορά ακουστικά να κοιτάξει ένα άτομο, την ώρα που μιλά, για δύο με τρία δευτερόλεπτα, προκειμένου να το "εγγράψει". Το σύστημα, με την ονομασία TSH (Target Speech Hearing), στη συνέχεια ακυρώνει όλους τους άλλους περιβάλλοντες ήχους και απλά αναπαράγει τη φωνή του εγγεγραμμένου ομιλητή σε πραγματικό χρόνο, ακόμη και όταν ο χρήστης των ακουστικών κινείται σε θορυβώδεις χώρους και δεν είναι πλέον στραμμένος προς τον ομιλητή.

Η ομάδα παρουσίασε τα ευρήματά της στο πλαίσιο διάσκεψης με θέμα τους Ανθρώπινους Παράγοντες στα Υπολογιστικά Συστήματα, το οποίο πραγματοποιήθηκε στη Χονολουλού. Ο κώδικας που επιτρέπει αυτή τη διαδικασία είναι διαθέσιμος σε όσους θα ενδιαφέρονταν να τον εξελίξουν. Το σύστημα δεν διατίθεται εμπορικά. 

Προκειμένου να ενεργοποιηθεί το σύστημα, ένα άτομο που φορά ένα απλό ζευγάρι εμπορικά διαθέσιμων ακουστικών, εφοδιασμένο με μικρόφωνα, πατά ένα πλήκτρο, ενώ στρέφει το κεφάλι του προς κάποιον ομιλητή. Τα ηχητηικά κύματα της φωνής του ομιλητή φτάνουν ταυτόχρονα στα μικρόφωνα που τοποθετημένα και στις δύο πλευρές των ακουστικών: υπάρχει περιθώριο σφάλματος 16 μοιρών. Τα ακουστικά στέλνουν το σήμα αυτό σε ενσωματωμένο υπολογιστή, όπου το λογισμικό μηχανικής μάθησης που ανέπτυξαν οι ερευνητές μαθαίνει τα φωνητικά μοτίβα του επιθυμητού ομιλητή. Το σύστημα εστιάζει στη φωνή του συγκεκριμένου ατόμου και συνεχίζει να την αναπαράγει στον ακροατή, ακόμη και όταν οι δυο τους κινούνται. Η ικανότητα του συστήματος να εστιάζει στην εγγεγραμμένη φωνή βελτιώνεται καθώς ο στόχος συνεχίζει να μιλά, προσφέροντας στο σύστημα περισσότερα εκπαιδευτικά δεδομένα.

Η ομάδα δοκίμασε το σύστημα σε 21 άτομα, τα οποία έδωσαν σχεδόν διπλάσια βαθμολογία κατά μέσο όρο στη διαύγεια της φωνής του εγγεγραμμένου ομιλητή σε σχέση με τον αφιλτράριστο ήχο.

Η διαδικασία αυτή βασίζεται σε προηγούμενη έρευνα της ομάδας, που επέτρεπε στους χρήστες να επιλέγουν συγκεκριμένες κατηγορίες ήχων -όπως τιτιβίσματα πουλιών ή φωνές ανθρώπων- τους οποίους ήθελαν να ακούνε, ακυρώνοντας άλλους ήχους του περιβάλλοντος.

Επί του παρόντος το TSH έχει τη δυνατότητα εγγραφής ενός μόνο ομιλητή τη φορά, ενώ μπορεί να προχωρά στην εγγραφή μόνο όταν δεν εντοπίζει άλλη δυνατή φωνή από την ίδια κατεύθυνση με αυτή του στόχου. Εφόσον ο χρήστης δεν είναι ευχαριστημένος με την ποιότητα του ήχου, μπορεί να προχωρήσει σε νένα διαδικασία εγγραφής, ώστε να έχει καλύτερο αποτέλεσμα.

Η ομάδα εργάζεται πάνω στη μελλοντική επέκταση του συστήματος ώστε να χρησιμοποιείται μέσω earbuds και βοηθημάτων βαρηκοΐας. 


Διαβάστε ολόκληρο το άρθρο

Δημοσ.

Τέλεια, τώρα ο μέσος άνθρωπος θα μπορεί να συζητάει τις π@@πριες που συζητάει συνήθως ανεξάρτητου περιβάλλοντος! 

Δημοσ.
52 λεπτά πριν, Galaxies είπε

Και που ξέρουν τα ακουστικά ποιον κοιτάω;

Βασικά δεν πατά στο που κοιτάς αλλά που έχεις στραμμένο το κεφάλι 

Δημοσ. (επεξεργασμένο)

Δεν έχουν δει γυναίκα να παρακολουθεί την μάγισσα ή αντίστοιχα σίριαλ. Ο μόνος τρόπος να σε ακούσει είναι να μπεις μπροστά στην τηλεόραση και αφού σε στολίσει. Εστίαση 100%

Οχι εγώ ένας φίλος από το χωριό. Δεν τον ξέρετε….

Επεξ/σία από Dimitris_1981
  • Haha 2
Δημοσ.

Αυτό δεν είναι τίποτα.

Η πραγματική επανάσταση θα ήταν να ΜΗΝ ακούς αυτόν που κοιτάς και να ακούς όλους τους άλλους.

😁😁

  • Haha 2
Δημοσ. (επεξεργασμένο)

Άκουσα πως τον καθηγητή τον προσέλαβαν για να εργαστεί στα μικρόφωνα του Amazon Echo πριν μερικά χρόνια. Το βίντεο είναι δεκαετίας.

 

Επεξ/σία από Athoz
Δημοσ.

Πολύ χρήσιμο αναλόγως προς που θα κινηθεί. Αν για παράδειγμα κινηθεί προς κλειδαρότρυπα μεριά, τοτε γ@μισε τα... Αν όμως από την άλλη βοηθήσει άτομα με βαρυκοΐα τότε είναι καλό. Χαίρομαι πολύ γενικά όταν η επιστήμη κάνει πράγματα που βελτιώνουν την καθημερινότητα του ανθρώπου. 

Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε

Πρέπει να είστε μέλος για να αφήσετε σχόλιο

Δημιουργία λογαριασμού

Εγγραφείτε με νέο λογαριασμό στην κοινότητα μας. Είναι πανεύκολο!

Δημιουργία νέου λογαριασμού

Σύνδεση

Έχετε ήδη λογαριασμό; Συνδεθείτε εδώ.

Συνδεθείτε τώρα
  • Δημιουργία νέου...