Μάλιστα, ένας developer, ο Kyle McDonald, δημοσίευσε πρόσφατα ένα βίντεο το οποίο δείχνει την εν λόγω διαδικασία και τους περιορισμούς της, σε πραγματικό χρόνο.
Χρησιμοποιώντας ένα MacBook Pro και μια τροποποιημένη έκδοση του προγράμματος NeuralTalk2, ο McDonald περιηγήθηκε στους δρόμους του Άμστερνταμ και κατέγραψε την προσπάθεια του υπολογιστή του να αναγνωρίσει τις εικόνες που έβλεπε.
Η διαδικασία περιγραφής όσων μας περιβάλλουν είναι αρκετά απλή για τον άνθρωπο, ωστόσο είναι αρκετά πολύπλοκη για έναν υπολογιστή, καθώς χρειάζεται να αναλύσει τη σκηνή, να αναγνωρίσει τα επιμέρους στοιχεία, καθώς και να εντοπίσει τη μεταξύ τους σχέση.
Όπως φαίνεται στο βίντεο, πολλές φορές το πρόγραμμα πραγματοποιεί επιτυχείς αναγνωρίσεις, παρέχοντας επικεφαλίδες όπως, λόγου χάρη, «σειρά από ποδήλατα παρκαρισμένα το ένα δίπλα στο άλλο» και «άντρας τρώει χοτ ντογκ στον δρόμο».
Ωστόσο, αρκετές από τις επικεφαλίδες που παρέχει το νευρωνικό δίκτυο είναι λανθασμένες και δεν ανταποκρίνονται στην πραγματικότητα, όπως, παραδείγματος χάρη, η δήλωση ότι ο McDonald φοράει κουστούμι και γραβάτα, ενώ στην πραγματικότητα φοράει φούτερ.
Το NeuralTalk2 είναι ένα πρόγραμμα ανοιχτού κώδικα, βασική ιδιότητα του οποίου είναι να παρέχει επικεφαλίδες προκειμένου να περιγράψει τις εικόνες που βλέπει. Βέβαια, δεν είναι ιδιαίτερα φιλικό προς τον χρήστη, καθώς απαιτεί αρκετό χρόνο για εξοικείωση.
https://www.youtube.com/watch?v=5o2EQlo1E3M
Site: DigitalTrends
ΣΧΟΛΙΑ (32)
Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε
Πρέπει να είστε μέλος για να αφήσετε σχόλιο
Δημιουργία λογαριασμού
Εγγραφείτε με νέο λογαριασμό στην κοινότητα μας. Είναι πανεύκολο!
Δημιουργία νέου λογαριασμούΣύνδεση
Έχετε ήδη λογαριασμό; Συνδεθείτε εδώ.
Συνδεθείτε τώραΔημοσίευση ως Επισκέπτης
· Αποσύνδεση