Προς το περιεχόμενο

Προτεινόμενες αναρτήσεις

Δημοσ.

Γεια σας παιδιά,

Έχω ένα αρχείο pdf το οποίο περιέχει σκαναρισμένο περιεχόμενο.Είναι μια εργασία που θέλω να κάνω αλλά το κείμενο είναι σε σκαναρισμένες εικόνες.Πως θα γίνει με κάποιο τρόπο να το εξάγω ώστε να το επεξεργαστώ σε word?

Δημοσ.

Μπορείς να μου εξηγήσεις τι είναι αυτό?Έτσι λέγεται το πρόγραμμα?

Τύπος προγραμμάτων λέγεται έτσι,optical character recognition,αναγνωρίζει δηλαδή χαρακτήρες,με αρχηγό το abby fine reader ,πολύ σπάνια όμως αυτό γίνεται αυτόματα θα πρέπει να κάθεσαι από πάνω του και να διορθώνεις ότι δεν καταλαβαίνει μόνο του. 

Δημοσ.

Έχω το Abby Fine Reader. Θα κάνω δουλειά με αυτό έτσι?

Yeap! Υποψιν οτι εξαρταται -σε πολυ μεγαλο βαθμο- απο πως και τι ειναι το:

"κείμενο είναι σε σκαναρισμένες εικόνες", μπορει δηλαδη τα scannaρισματα,

να ειναι απο τελεια εως χαλια... Και το κεμενο τους, απο βιβλιο στα αγγλικα,

ως ελληνικες εφημεριδες σε πολυτονικο [εχω δοκιμασει (σ)τα παντα λεμε...]

 

Πλην της περιπτωσης να ξερεις τυφλο συστημα, κερδιζεις χρονο με το ocr!

Tip: To Abbyy, διορθωνει και το ιδιο/αυτοβουλως contrast κ.λπ., αλλα στην

περιπτωση που ειναι χαλια, ή μικρες, οι εικονες του .pdf, κανε τους export

σε .tiff και διορθωσε τους brightness & contrast και μεγαλωσε τες = resize.  

Μετα, περασε τες απο το Fine Reader, για ακομη καλυτερη αναγνωριση :-)

  • Like 2

Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε

Πρέπει να είστε μέλος για να αφήσετε σχόλιο

Δημιουργία λογαριασμού

Εγγραφείτε με νέο λογαριασμό στην κοινότητα μας. Είναι πανεύκολο!

Δημιουργία νέου λογαριασμού

Σύνδεση

Έχετε ήδη λογαριασμό; Συνδεθείτε εδώ.

Συνδεθείτε τώρα
  • Δημιουργία νέου...