Ακουστικά τεχνητής νοημοσύνης επιτρέπουν στο χρήστη να ακούσει ένα άτομο μέσα στο πλήθος, κοιτάζοντάς το μόνο μία φορά

Crash24 · 29 Μαΐου 2024

Ερευνητές στο Πανεπιστήμιο της Ουάσιγκτον ανέπτυξαν σύστημα τεχνητής νοημοσύνης που "κλειδώνει" σε συγκεκριμένο άτομο, μέσα σε ελάχιστη ώρα.

Τα ακουστικά ακύρωσης θορύβου έχουν εξελιχτεί πολύ στο να δημιουργούν ένα φιλικότερο ηχητικό περιβάλλον για το χρήστη, αποκλείοντας τη συντριπτική πλειοψηφία των ήχων. Όμως, το να επιτρέπουν σε συγκεκριμένους ήχους από το περιβάλλον να περνούν από το τείχος αυτό εξακολουθεί να συνιστά πρόκληση για τους ερευνητές. Η νέα έκδοση των AirPods Pro της Apple, λόγου χάρη, ρυθμίζει αυτόματα τα επίπεδα του ήχου -έχοντας τη δυνατότητα να αντιληφθεί πότε συνομιλείτε, λόγου χάρη- όμως ο χρήστης έχει ελάχιστο έλεγχο πάνω στο ποιον θέλουν να ακούσουν ή πότε συμβαίνει αυτό.

Ομάδα ερευνητών του Πανεπιστημίου της Ουάσιγκτον ανέπτυξε σύστημα τεχνητής νοημοσύνης το οποίο επιτρέπει σε χρήστη που φορά ακουστικά να κοιτάξει ένα άτομο, την ώρα που μιλά, για δύο με τρία δευτερόλεπτα, προκειμένου να το "εγγράψει". Το σύστημα, με την ονομασία TSH (Target Speech Hearing), στη συνέχεια ακυρώνει όλους τους άλλους περιβάλλοντες ήχους και απλά αναπαράγει τη φωνή του εγγεγραμμένου ομιλητή σε πραγματικό χρόνο, ακόμη και όταν ο χρήστης των ακουστικών κινείται σε θορυβώδεις χώρους και δεν είναι πλέον στραμμένος προς τον ομιλητή.

Η ομάδα παρουσίασε τα ευρήματά της στο πλαίσιο διάσκεψης με θέμα τους Ανθρώπινους Παράγοντες στα Υπολογιστικά Συστήματα, το οποίο πραγματοποιήθηκε στη Χονολουλού. Ο κώδικας που επιτρέπει αυτή τη διαδικασία είναι διαθέσιμος σε όσους θα ενδιαφέρονταν να τον εξελίξουν. Το σύστημα δεν διατίθεται εμπορικά.

Προκειμένου να ενεργοποιηθεί το σύστημα, ένα άτομο που φορά ένα απλό ζευγάρι εμπορικά διαθέσιμων ακουστικών, εφοδιασμένο με μικρόφωνα, πατά ένα πλήκτρο, ενώ στρέφει το κεφάλι του προς κάποιον ομιλητή. Τα ηχητηικά κύματα της φωνής του ομιλητή φτάνουν ταυτόχρονα στα μικρόφωνα που τοποθετημένα και στις δύο πλευρές των ακουστικών: υπάρχει περιθώριο σφάλματος 16 μοιρών. Τα ακουστικά στέλνουν το σήμα αυτό σε ενσωματωμένο υπολογιστή, όπου το λογισμικό μηχανικής μάθησης που ανέπτυξαν οι ερευνητές μαθαίνει τα φωνητικά μοτίβα του επιθυμητού ομιλητή. Το σύστημα εστιάζει στη φωνή του συγκεκριμένου ατόμου και συνεχίζει να την αναπαράγει στον ακροατή, ακόμη και όταν οι δυο τους κινούνται. Η ικανότητα του συστήματος να εστιάζει στην εγγεγραμμένη φωνή βελτιώνεται καθώς ο στόχος συνεχίζει να μιλά, προσφέροντας στο σύστημα περισσότερα εκπαιδευτικά δεδομένα.

Η ομάδα δοκίμασε το σύστημα σε 21 άτομα, τα οποία έδωσαν σχεδόν διπλάσια βαθμολογία κατά μέσο όρο στη διαύγεια της φωνής του εγγεγραμμένου ομιλητή σε σχέση με τον αφιλτράριστο ήχο.

Η διαδικασία αυτή βασίζεται σε προηγούμενη έρευνα της ομάδας, που επέτρεπε στους χρήστες να επιλέγουν συγκεκριμένες κατηγορίες ήχων -όπως τιτιβίσματα πουλιών ή φωνές ανθρώπων- τους οποίους ήθελαν να ακούνε, ακυρώνοντας άλλους ήχους του περιβάλλοντος.

Επί του παρόντος το TSH έχει τη δυνατότητα εγγραφής ενός μόνο ομιλητή τη φορά, ενώ μπορεί να προχωρά στην εγγραφή μόνο όταν δεν εντοπίζει άλλη δυνατή φωνή από την ίδια κατεύθυνση με αυτή του στόχου. Εφόσον ο χρήστης δεν είναι ευχαριστημένος με την ποιότητα του ήχου, μπορεί να προχωρήσει σε νένα διαδικασία εγγραφής, ώστε να έχει καλύτερο αποτέλεσμα.

Η ομάδα εργάζεται πάνω στη μελλοντική επέκταση του συστήματος ώστε να χρησιμοποιείται μέσω earbuds και βοηθημάτων βαρηκοΐας.

Διαβάστε ολόκληρο το άρθρο

Galaxies · 31 Μαΐου 2024

Και που ξέρουν τα ακουστικά ποιον κοιτάω;

cpc464 · 31 Μαΐου 2024

Με άλλα λόγια η χαρά του κάθε Αρτέμη Μάτσα και του κάθε κουτσομπόλη.

Pitoo · 31 Μαΐου 2024

Τέλεια, τώρα ο μέσος άνθρωπος θα μπορεί να συζητάει τις π@@πριες που συζητάει συνήθως ανεξάρτητου περιβάλλοντος!

darkf · 31 Μαΐου 2024

"στο χρήση"?????

korakios · 31 Μαΐου 2024

52 λεπτά πριν, Galaxies είπε

Και που ξέρουν τα ακουστικά ποιον κοιτάω;

Βασικά δεν πατά στο που κοιτάς αλλά που έχεις στραμμένο το κεφάλι

smpt · 31 Μαΐου 2024

το θέλει η γυναίκα μου. Εχει βάλει στο μάτι την απέναντι

ZaChris · 31 Μαΐου 2024

1 hour ago, Galaxies said:

Και που ξέρουν τα ακουστικά ποιον κοιτάω;

το γνωστο "ακου να δεις"

Dimitris_1981 · 31 Μαΐου 2024

Δεν έχουν δει γυναίκα να παρακολουθεί την μάγισσα ή αντίστοιχα σίριαλ. Ο μόνος τρόπος να σε ακούσει είναι να μπεις μπροστά στην τηλεόραση και αφού σε στολίσει. Εστίαση 100%

Οχι εγώ ένας φίλος από το χωριό. Δεν τον ξέρετε….

Επεξ/σία 31 Μαΐου 2024 από Dimitris_1981

Lanike71 · 31 Μαΐου 2024

Αυτό δεν είναι τίποτα.

Η πραγματική επανάσταση θα ήταν να ΜΗΝ ακούς αυτόν που κοιτάς και να ακούς όλους τους άλλους.

😁😁

freegr · 1 Ιουνίου 2024

Προφανώς όλα σε θεωρητικό επίπεδο μέχρι να γίνει εμπορικό προϊόν;

KyrGR · 1 Ιουνίου 2024

Α ρε μεγάλε Τζωρτζ Όργουελ, τύφλα νάχει η Πυθία !

Captain Nemo · 1 Ιουνίου 2024

Spoiler

Και άμα κοιτάς όρτσα;

Athoz · 1 Ιουνίου 2024

Άκουσα πως τον καθηγητή τον προσέλαβαν για να εργαστεί στα μικρόφωνα του Amazon Echo πριν μερικά χρόνια. Το βίντεο είναι δεκαετίας.

Επεξ/σία 1 Ιουνίου 2024 από Athoz

vastegial_74 · 1 Ιουνίου 2024

Πολύ χρήσιμο αναλόγως προς που θα κινηθεί. Αν για παράδειγμα κινηθεί προς κλειδαρότρυπα μεριά, τοτε γ@μισε τα... Αν όμως από την άλλη βοηθήσει άτομα με βαρυκοΐα τότε είναι καλό. Χαίρομαι πολύ γενικά όταν η επιστήμη κάνει πράγματα που βελτιώνουν την καθημερινότητα του ανθρώπου.

Σύνδεση

Ακουστικά τεχνητής νοημοσύνης επιτρέπουν στο χρήστη να ακούσει ένα άτομο μέσα στο πλήθος, κοιτάζοντάς το μόνο μία φορά

Προτεινόμενες αναρτήσεις

Crash24

Galaxies

cpc464

Pitoo

darkf

korakios

smpt

ZaChris

Dimitris_1981

Lanike71

freegr

KyrGR

Captain Nemo

Athoz

vastegial_74

Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε

Δημιουργία λογαριασμού

Σύνδεση

Σύνδεση