Προς το περιεχόμενο

Προτεινόμενες αναρτήσεις

Δημοσ.

Αν και ο οδηγός αυτό δημιουργήθηκε αρχικά για να εξαγάγεις γιαπωνέζικους υπότιτλους από το Netflix μετά επεκτάθηκε και σε άλλες γλώσσες. Με δική μου προτροπή ο Alan πρόσθεσε και τα ελληνικά. Χρησιμοποιεί την υπηρεσία της Google, ονόματι Cloud Vision API για να κάνει οπτική αναγνώριση χαρακτήρων (OCR). Σε γλώσσες που δεν έχουν περίπλοκους χαρακτήρες, όπως Αγγλικά, Γαλλικά, κ.ά, το αρχείο είναι srt. Αλλά με άλλες γλώσσες όπως ελληνικά, γιαπωνέζικα, κ.ά τα αποθηκεύει σε png μορφή (αρκετά αρχεία) μαζί με ένα αρχείο xml και δύο idx (προφανώς υπάρχουν μέσα σε αυτά οι χρονισμοί). O Alan έχει βελτιώσει το ήδη υπάρχον πρόγραμμα που κάνει οπτική αναγνώριση χαρακτήρων και στο τέλος δημιουργεί ένα αρχείο srt με τους χρόνους κανονικά. Έχει πολύ καλή αναγνώριση το Cloud Vision και το αποτέλεσμα είναι σχεδόν άριστο.

Πώς δουλεύει τώρα το όλο εγχείρημα. Πρώτα πρέπει να κατεβάσετε μια επέκταση στον περιηγητή που χρησιμοποιείτε, ονόματι, ViolentMonkey και δουλεύει και με  firefox και με chrome. Υπάρχουν και παραπλήσιες επεκτάσεις όπως οι TamperMonkey και GreaseMonkey.

Το επόμενο βήμα είναι να εγκαταστήσουμε αυτό το script ->Netflix Subtitle Downloader. Στη σελίδα που μας ανοίγει πατάμε Install this script και στο νέο παράθυρο που ανοίγει πατάμε επάνω δεξιά Confirm Installation και είναι έτοιμο. Μετά την εγκατάσταση όταν μπείτε στη σελίδα του Netflix και πατήσετε να δείτε κάτι, στους υπότιτλους θα σας βγάζει κάτι τέτοιο.

 

Πατάτε να κατεβάσετε τους υπότιτλους. Σημείωση πως ενδέχεται αφού πατήσετε Download να μην σας βγάλει αμέσως το πλαίσιο για αποθήκευση. Συνήθως αν είναι να κατεβάσει srt το εμφανίζει αμέσως, ενώ αν είναι zip (png, xml, idx) θα αργήσει λίγο.

 

Δημιουργώντας ένα κλειδί API για το Google Cloud Vision API

 

Στην περίπτωση (ελληνικά) κατεβάζει zip. Άρα θα πρέπει να προχωρήσουμε σε οπτική αναγνώριση. Μια πολύ καλή υπηρεσία είναι το Google Cloud Vision. Είναι δωρεάν εφόσον χρησιμοποιείς κάθε μήνα μέχρι 1000 εικόνες για αναγνώριση. Πρώτα πρέπει να εγγραφούμε στο Google Cloud Platform και μετά την εγγραφή πρέπει να ενεργοποιήσουμε το Cloud Vision API και να δημιουργήσουμε ένα κλειδί API.

1ο. Στο αριστερό μέρος επιλέγουμε APIs & Services>Dashboard

2ο. Επιλέγουμε Enable APIs & Services

3ο. Στο search box γράφουμε  “Vision” και μετά επιλέγουμε Google Cloud Vision API

4ο. Επιλέγουμε Enable. Ίσως σας ζητήσει να εισάγετε πληροφορίες για χρέωση κάρτας. Αλλά αυτό  είναι τυπικό για να βεβαιωθεί πως δεν είναι κάποιο bot. Δεν χρεώνει τίποτα. Δοκιμασμένο από εμένα.

5ο. Πίσω στο μενού APIs & Services Dashboard, επιλέξτε Credentials > Create Credentials > API Key.

6ο. Όταν δημιουργήσετε το κλειδί API αποθηκεύστε το κάπου ή αφήστε ανοιχτό τον περιηγητή σας γιατί θα χρειαστεί μετά που θα το εισάγουμε στο πρόγραμμα παρακάτω.

 

Χρησιμοποίηση του εργαλείου generate_srt_from_netflix

Αυτό το πρόγραμμα αναλαμβάνει να στείλει τα png αρχεία για ocr στο Google Cloud Vision και μετά να δημιουργήσει ένα srt.

Αν είστε σε windows κατεβάζετε αυτό-> generate_srt_from_netflix.Win.x86.zip

Linux αυτό-> generate_srt_from_netflix.Linux.tar.gz

Για Mac δεν έχει βγει κάτι ακόμη αλλά αν έχετε εμπειρία με την python μπορείτε να δοκιμάσετε να εκτελέσετε αυτό το script. Χρησιμοποιεί Python 3 και τα παρακάτω 3 επιπλέον πακέτα: pillow, requests και gooey.

To επόμενο βήμα είναι επικολλήσετε το κλειδί API μέσα στο αρχείο κειμένου API_KEY.txt που υπάρχει στον φάκελο που θα αποσυμπιέσετε το πρόγραμμα. Όταν θα τρέξετε την εφαρμογή θα μοιάζει κάπως έτσι.

 

Πρώτα κοιτάτε αν δείχνει επάνω σωστά το κλειδί API σας. Μετά επιλέξτε τον φάκελο με τα αρχεία png, xml, idx που πριν ήταν συμπιεσμένα σε ένα zip. Μετά επιλέγετε την γλώσσα αναγνώρισης, “el” στην δική μας περίπτωση. Πατάτε start και περιμένετε να τελειώσει.

Το chunk size δεν χρειάζεται να το πειράξετε. Το 15 είναι συνήθως μια χαρά. Αν το πρόγραμμα αρχίζει να δουλεύει αλλά μετά σας βγάζει σφάλμα, ίσως χρειαστεί να το μειώσετε σε 10 ή ακόμη και 5.

Αν όλα πάνε καλά όταν τελειώσει το πρόγραμμα θα έχει δημιουργηθεί ένα srt αρχείο στον φάκελο με τα png, xml, idx. Λογικά θα βγάλει λίγα λάθη αλλά διορθώνονται πολύ γρήγορα.

 

Τα credits πηγαίνουν στον Alan που έφτιαξε ολόκληρο τον οδηγό, στον TITHEN-FIRION για το σκριπτάκι, τον zx573 για το πρόγραμμα generate_srt_from_netflix (το αρχικό τουλάχιστον, καθώς ο Alan είναι αυτός που το έκανε περισσότερο φιλικό προς τον χρήστη). Αυτά τα αλάνια το έκαναν πραγματικότητα. Εγώ απλώς έγραψα αυτόν τον οδηγό (όλα αντιγραφή από  αυτόν) και ενόχλησα τον Alan για το ότι δεν είχε επιλογή για ελληνική γλώσσα. Αυτά τα ολίγα!

 

  • Like 4
Δημοσ.

Έχω στείλει email στον δημιουργό του Subtitle Edit ώστε να προσθέσει και το google  cloud vision στο πρόγραμμά του γιατί τα default που έχει είναι πολύ χάλια στο OCR.

Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε

Πρέπει να είστε μέλος για να αφήσετε σχόλιο

Δημιουργία λογαριασμού

Εγγραφείτε με νέο λογαριασμό στην κοινότητα μας. Είναι πανεύκολο!

Δημιουργία νέου λογαριασμού

Σύνδεση

Έχετε ήδη λογαριασμό; Συνδεθείτε εδώ.

Συνδεθείτε τώρα
  • Δημιουργία νέου...