Οπτική αναγνώριση χαρακτήρων σε πολυτονικό κείμενο

accipio · 27 Ιουνίου 2017

Η οπτική αναγνώριση χαρακτήρων (optical character recognition ή ocr) σε πολυτονικό κείμενο (αρχαία ελληνικά, καθαρεύουσα) είναι ζητούμενο για πολλούς χρήστες αλλά δεν διατίθεται ως επιλογή από τα κορυφαία προγράμματα του είδους, όπως το ABBYY Finereader (εκτός αν… έχασα επεισόδια και δεν το ξέρω). Υπάρχουν όμως δύο δωρεάν λύσεις που μπορούν να μας προσφέρουν αυτή τη δυνατότητα: η εφαρμογή Capture2Text, καθώς και η εφαρμογή gImageReader, σε συνδυασμό με το πρότζεκτ tesseract. Σε αυτόν το σύντομο οδηγό θα αναφερθώ στην πρώτη εφαρμογή.

Capture2Text

Η εφαρμογή Capture2Text προορίζεται να αναγνωρίζει κείμενο που βλέπουμε στην οθόνη, δηλ. κάτι αντίστοιχο του εμπορικού ABBYY ScreenshotReader. Είναι ικανή να αναγνωρίσει μόνο μία γλώσσα και όχι περισσότερες ταυτόχρονα. Επίσης έχει και τη δυνατότητα αυτόματης μετάφρασης (με τη χρήση του Google Translate) αλλά δε θα μας απασχολήσει εδώ αυτή η λειτουργία.

Λειτουργεί σε Windows 7, 8 και 10 - εγώ τη δοκίμασα στην τελευταία έκδοση των ελληνικών Windows 10 64 bit με το Creators Update. Τα Windows XP υποστηρίζονται από εκδόσεις προηγούμενες της έκδοσης 4.

- Σελίδα εφαρμογής: http://capture2text.sourceforge.net/

- Κατεβάζουμε την εφαρμογή από εδώ.

Τρέχουσα έκδοση είναι η 4.3.0. Επιλέγουμε την κατάλληλη αρχιτεκτονική (32 bit ή 64 bit) ανάλογα με την έκδοση Windows που έχουμε.

Θα χρειαστούμε επιπρόσθετα δύο αρχεία, ένα για την ελληνική και ένα για την αρχαία ελληνική γλώσσα. Τα κατεβάζουμε από εδώ.

Το αρχείο ell.traineddata (12 MB) είναι για τα ελληνικά κείμενα και το αρχείο grc.traineddata (12,2 MB) για τα πολυτονικά.

ΕΓΚΑΤΑΣΤΑΣΗ

Η εφαρμογή έχει μέγεθος λίγο πάνω από τα 60 MB, είναι portable και δεν απαιτεί εγκατάσταση· απλώς την αποσυμπιέζουμε σε έναν φάκελο της επιλογής μας. Στη συνέχεια πηγαίνουμε μέσα στον φάκελο αυτό και προσθέτουμε στον υποφάκελο tessdata τα αρχεία ell.traineddata και grc.traineddata.

Οι ρυθμίσεις που κάνουμε στην εφαρμογή αποθηκεύονται σε αρχείο .ini στη διαδρομή C:\Users\[username]\AppData\Roaming\Capture2Text.

ΕΚΤΕΛΕΣΗ - ΡΥΘΜΙΣΕΙΣ

Εκτελούμε την εφαρμογή με διπλό κλικ στο αρχείο Capture2Text.exe (αν θέλουμε, φτιάχνουμε συντόμευσή του στην επιφάνεια εργασίας ή στη γραμμή εργασιών για γρήγορη πρόσβαση). Μόλις το εκτελέσουμε, το εικονίδιο της εφαρμογής θα εμφανιστεί στη γραμμή εργασιών κάτω δεξιά (εφόσον έχουμε την προεπιλεγμένη ρύθμιση των Windows για τη θέση της γραμμής εργαλείων). Με δεξί κλικ πάνω του έχουμε πρόσβαση στις ρυθμίσεις (Settings), στην τρέχουσα γλώσσα αναγνώρισης και σε διάφορες άλλες επιλογές.

Με κλικ στο Settings βλέπουμε (και αλλάζουμε, αν το επιθυμούμε) στην καρτέλα Hotkeys τα πλήκτρα συντόμευσης με τα οποία μπορούμε να χειριζόμαστε την εφαρμογή. Στην καρτέλα OCR1 βλέπουμε, ανάμεσα σε άλλα, τις διαθέσιμες γλώσσες αναγνώρισης και τη λίστα με τις γλώσσες γρήγορης πρόσβασης· εδώ μπορούμε να ορίσουμε τις τρεις γλώσσες που θέλουμε (π.χ. Greek, Ancient Greek, English, και τη σειρά που μας εξυπηρετεί) και διάφορες άλλες διαθέσιμες ρυθμίσεις που δεν θα μας απασχολήσουν ιδιαίτερα.

Ο προεπιλεγμένος συνδυασμός πλήκτρων για την έναρξη της αναγνώρισης είναι Win+Q. Για την επιλογή της 1ης γλώσσας αναγνώρισης το Win+1, της 2ης γλώσσας το Win+2 και της 3ης γλώσσας το Win+3.

ΛΕΙΤΟΥΡΓΙΑ

Εκτελούμε την εφαρμογή και επιλέγουμε τη βασική γλώσσα αναγνώρισης, π.χ. Ancient Greek.

Εμφανίζουμε το πολυτονικό κείμενο στην οθόνη, είτε αυτό βρίσκεται σε pdf, είτε σε αρχείο εικόνας (jpg, tif κτλ.). Φροντίζουμε να το μεγεθύνουμε ώστε να φαίνεται όσο το δυνατόν πιο καθαρά στην οθόνη.

Αφού φέρουμε το κείμενο σε τέτοια θέση ώστε να το βλέπουμε όλο στην οθόνη –ή τουλάχιστον όλο το πλάτος του– μετακινούμε τον δείκτη το ποντικιού σε μία από τις τέσσερις γωνίες του κειμένου (π.χ. πάνω και αριστερά, λίγο πάνω από το κείμενο) και πατάμε Win+Q. Στη συνέχεια μετακινούμε το ποντίκι προς την αντίθετη κατεύθυνση διαγώνια, ώστε να επιλέξουμε τις γραμμές κειμένου που θέλουμε. Καθώς κάνουμε αυτή την κίνηση, βλέπουμε ένα διάφανο γαλάζιο πλαίσιο να καλύπτει το κείμενο και ταυτόχρονα, στο πάνω μέρος της οθόνης, μια γραμμή στην οποία εμφανίζεται σε προεπισκόπηση το αναγνωρισμένο κείμενο (αν κάναμε λάθος, μπορούμε πατώντας Escape να ακυρώσουμε τη διαδικασία ώστε να ξαναπροσπαθήσουμε).

Αφού φέρουμε τον δείκτη του ποντικιού στο απέναντι μέρος του κειμένου (π.χ. κάτω δεξιά, λίγο πιο κάτω από το κείμενο) ώστε να καλύψουμε με το πλαίσιο όλο το κείμενο που μας ενδιαφέρει, πατάμε πάλι Win+Q ή, εναλλακτικά, κάνουμε αριστερό κλικ με το ποντίκι, για να αρχίσει η οπτική αναγνώριση.

Μόλις αυτή ολοκληρωθεί, θα εμφανιστεί ένα παράθυρο με το αποτέλεσμα. Σε αυτό το παράθυρο μπορούμε, προαιρετικά, να κάνουμε τις διορθώσεις που θέλουμε (η εφαρμογή, φυσικά, δεν είναι αλάνθαστη και σίγουρα θα κάνει λάθη) ή να τις αφήσουμε για αργότερα. Αφού τελειώσουμε με τις διορθώσεις πατάμε το OK και το αποτέλεσμα μεταφέρεται στην προσωρινή μνήμη (Πρόχειρο - Clipboard) των Windows, ώστε να το επικολλήσουμε σε επεξεργαστή κειμένου ή άλλη ανάλογη εφαρμογή για περαιτέρω επεξεργασία. Το κείμενο επικολλάται χωρίς μορφοποίηση.

Επαναλαμβάνουμε τη διαδικασία αυτή για όλο το κείμενο που θέλουμε.

Για να κλείσουμε την εφαρμογή, κάνουμε δεξί κλικ στο εικονίδιό της στο tray και πατάμε Exit.

Ελπίζω να φανεί χρήσιμο το θέμα σε όποιον ενδιαφέρεται για αναγνώριση πολυτονικού κειμένου - και όχι μόνο!

_Theo_ · 27 Ιουνίου 2017

Μπράβο φίλε!! Αυτό τον καιρό ασχολούμαι με τα λογισμικά OCR. Πολύ ωραίο κείμενο.

Σύνδεση

Οπτική αναγνώριση χαρακτήρων σε πολυτονικό κείμενο

Προτεινόμενες αναρτήσεις

accipio

_Theo_

Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε

Δημιουργία λογαριασμού

Σύνδεση

Σύνδεση