Προς το περιεχόμενο

Πρόβλημα με copy paste από pdf....


Physics_Rulez

Προτεινόμενες αναρτήσεις

Δημοσ.

Το γνωστό πρόβλημα. Κάνω copy από ένα αρχείο pdf με ελληνικό κείμενο και paste στο word, και εμφανίζεται με κινέζικα. Έτσι

 

åéäéêüôçôá: "Çëåêôñïëüãïò Ìç÷áíéêüò êáé Ìç÷áíéêüò Õðï-

ëïãéóôþí", ãéá ôçí åîåéäéêåõìÝíç ôå÷íéêÞ åñãáóôçñéáêÞ õðïóôÞñéîç ôùí åñ-

ãáóôçñßùí Ç/Õ ôïõ ÔìÞìáôïò.

 

Δοκίμασα το fine reader 9 pro και το αποτέλεσμα ήταν απογοητευτικό με πολλά λάθη (αν σκεφτείτε οτι είναι πάνω από 200 σελίδες, δεν μπορώ να τα διορθώσω ένα ένα)

 

Τι να κάνω;:shock:

Δημοσ.

Αν εμφανίζεται έτσι είσαι τυχερός... Το "κινέζικο" κείμενο που γράφεις είναι:

 

ειδικότητα: "Ηλεκτρολόγος Μηχανικός και Μηχανικός Υπο-

λογιστών", για την εξειδικευμένη τεχνική εργαστηριακή υποστήριξη των ερ-

γαστηρίων Η/Υ του Τμήματος.

 

Αν έχεις Word 2003 χρησιμοποίησε την εντολή "Επιδιόρθωση κατεστραμμένου κειμένου".

Αν έχεις Word 2007, ρίξε μια ματιά εδώ.

  • 1 χρόνο αργότερα...
Δημοσ.

Παίδες, εγώ πάλι αντιμετωπίζω το εξής πρόβλημα στο copy/paste με ένα .pdf αρχείο.

Eνώ το κείμενο στο .pdf είναι ελληνικά, όταν κάνω paste στο Word το κείμενο εμφανίζεται σαν μια περίεργη μίξη greeklish και κάποιον Κυριλλικών χαρακτήρων. Για παράδειγμα η παρακάτω πρόταση:

 

Επιτρέπεται η ανατύπωση, αποθήκευση και διανομή για σκοπό μη κερδοσκοπικό

 

Εμφανίζεται έτσι:

Epitrèpetai h anatÔpwsh, apojakeush kai dianoma gia skopì mh kerdoskopikì

 

Δοκίμασα επιδιόρθωση, αλλα τίποτα, τα ίδια.

Σκέφτηκα οτι ίσως φταίει που η ελληνική γραμματοσειρά στο pdf δεν είναι κάποια στάνταρ (Arial, New Roman κλπ) και εγκατέστησα ο,τι είχα σε γραμματοσειρές μπας και την πετύχω κάπου μεσα στο χάος, αλλα πάλι τα ίδια.

Λέτε να φταίει που έχω το Οffice 2003;

 

Γενικά ακούω ιδέες/προτάσεις σχετικά με το τί μπορεί να φταίει

Δημοσ.

Αδυνατώ να δώσω εξήγηση σε τέτοια "κουφά" φαινόμενα... Αλλά η λύση για την περίπτωσή σου λέγεται FineReader ή ScreenShot Reader (συνοδευτικό του FR).

Δημοσ.

Πάω στοίχημα οτι δεν το κάνεις με το select tool για κείμενο αλλά σαν εικόνα και το περνάς απο OCR χωρις να έχεις φορτώσει τα Ελληνικά :)

Δημοσ.

accipio γράφεις:

Fix broken text

Description: The ability to open Word 6.0 documents and fix broken text (that is, to turn 8-bit characters into 16-bit characters) is removed.

Reason for change: This is a low-use feature for a legacy issue.

Migration path: This tool will remain available online.

Μήπως αντί να κάνουμε όλη τη φασαρία που περιγράφεις στο άλλο thread βρήκες καμιά πιο γρήγορη λύση ή κάποιο τρόπο ίσως να ενσωματώσουμε το fix broken text στο καινούριο office εφόσον λέει ότι παραμένει available online?

Δημοσ.
Μήπως αντί να κάνουμε όλη τη φασαρία που περιγράφεις στο άλλο thread βρήκες καμιά πιο γρήγορη λύση ή κάποιο τρόπο ίσως να ενσωματώσουμε το fix broken text στο καινούριο office εφόσον λέει ότι παραμένει available online?

Όχι, αλλά δεν το πολυέψαξα. Δεν νομίζω πάντως να γίνεται κάτι τέτοιο. Άλλωστε, το Antioch με εξυπηρετεί μια χαρά.

 

..Τα ελληνικα μου...

Fix broken text for Word 6.0 documents: This is a low-use feature for a legacy issue. If needed, download the Word Font Repair Macro from the Microsoft Download Center.

download link

Το δοκίμασα, αλλά δίνει το εξής error:

Setup Error

Setup has detected that you do not have an Office 2000 family product installed on this machine. Before this download can be installed you must first install an Office 2000 family product. To find out which products are part of the Office 2000 family, goto http://officeupdate.microsoft.com/info/o2kprods.htm.

Δημοσ.

Σωστός, αυτό που έδωσα είναι για 2000. Για 2003 πας Control panel ->Add/remove -> office 2003 -> change -> add/remove -> τσεκαρεις το advanced k next-> κατω απο το Microsoft word επιλεγεις το repair broken text να τρεχει απο τον υπολογιστή και προχωρας την εγκατασταση.

Αρχειοθετημένο

Αυτό το θέμα έχει αρχειοθετηθεί και είναι κλειστό για περαιτέρω απαντήσεις.

  • Δημιουργία νέου...