Προς το περιεχόμενο

Μετατροπή αρχείου κειμένου σε UTF-8


Dr_Michael

Προτεινόμενες αναρτήσεις

Δημοσ.

Έχω ένα αρχείο με όνομα: en.rs

Ουσιαστικά πρόκειται για text document.

Αυτό ήταν στα Αγγλικά και το μετέφρασα στα Ελληνικά.

Δυστυχώς όμως το encoding δεν ήταν UTF-8 οπότε τα Ελληνικά δεν παίζουν σωστά. Πώς μπορώ να το αλλάξω σε utf;

Δημοσ.

Για να κάνεις απλά τη δουλειά σου, γράψε emeditor Google και κατέβασε το ομώνυμο πρόγραμμα.

 

Άνοιξε το αρχείο κειμένου με τον editor αυτόν και μετά επέλεξε save as. Επέλεξε την κωδικοποίηση που θες (UTF-8 στην περίπτωση αυτή) και είσαι έτοιμος.

Δημοσ.
Το ίδιο και στο σημειωματάριο.

Αρχείο->Αποθήκευση Ως και στην Κωδικοποίηση βάλε UTF-8.

[ATTACH]15105[/ATTACH]

 

Το έχω ήδη δοκιμάσει αυτό αλλά δεν έπαιξε, αφού το αρχικό αρχείο έχει ήδη πρόβλημα στο encoding (τα Ελληνικά δεν διαβάζονται).

Δημοσ.

Μήπως το αρχείο το επεξεργάστηκες σε άλλο PC από αυτό που προσπαθείς να αλλάξεις το encoding; Δηλαδή, μήπως στο τρέχον PC υπάρχει το πρόβλημα που περιγράφεται εδώ: [[Windows XP και πρόβλημα Ελληνικών χαρακτήρων]] ;

Δημοσ.
Μήπως το αρχείο το επεξεργάστηκες σε άλλο PC από αυτό που προσπαθείς να αλλάξεις το encoding; Δηλαδή, μήπως στο τρέχον PC υπάρχει το πρόβλημα που περιγράφεται εδώ: [[Windows XP και πρόβλημα Ελληνικών χαρακτήρων]] ;

 

Όχι. Μόνο σε Windows Vista.

Όπως και να χει, σημασία έχει ότι πλέον το original αρχείο δεν δείχνει σωστά τα Ελληνικά και ακόμα και αν μετατραπεί σε UTF-8 πάλι τίποτα.

Δημοσ.

Μια περίπτωση είναι να κάνεις εισαγωγή στο word το προβληματικό αρχείο και να "παίξεις" με τις επιλογές κωδικοποίησης.

Μια άλλη είναι να επιλέξεις όλο το κείμενο στο σημειωματάριο (CTRL+A) και να δοκιμάσεις μια άλλη γραμματοσειρά (π.χ. times new roman ή arial)

Δημοσ.
Μια περίπτωση είναι να κάνεις εισαγωγή στο word το προβληματικό αρχείο και να "παίξεις" με τις επιλογές κωδικοποίησης.

Μια άλλη είναι να επιλέξεις όλο το κείμενο στο σημειωματάριο (CTRL+A) και να δοκιμάσεις μια άλλη γραμματοσειρά (π.χ. times new roman ή arial)

 

Τα έχω κάνει αυτά ήδη. Τζίφος! Μόνο το ConText το ανοίγει σωστά αλλά δεν το μετατρέπει σε utf8.

Δημοσ.

και αν κάνεις αντιγραφή από αυτό και επικόλληση στο word?

Πάντως, απ' ότι βλέπω στο ConText, χρησιμοποιεί την Courier New γραμματοσειρά, αλλά το file format είναι DOS.

Πάνε Tools->Convert text to->Unicode και σώσε σε άλλο αρχείο.

Αλλιώς, στην εισαγωγή στο word επέλεξε DOS και νομίζω θα στο περάσει.

Δημοσ.
και αν κάνεις αντιγραφή από αυτό και επικόλληση στο word?

Πάντως, απ' ότι βλέπω στο ConText, χρησιμοποιεί την Courier New γραμματοσειρά, αλλά το file format είναι DOS.

Πάνε Tools->Convert text to->Unicode και σώσε σε άλλο αρχείο.

Αλλιώς, στην εισαγωγή στο word επέλεξε DOS και νομίζω θα στο περάσει.

 

Ευχαριστώ micos000! Έπαιξε ως εξής:

 

Άνοιγμα με context, μετατροπή σε DOS (αφού ήταν ήδη σε utf-8), άνοιγμα με Word σε DOS και μετά αντιγραφή-επικόλληση στο σημειωματάριο και αποθήκευση σε UTF-8. :D

Αρχειοθετημένο

Αυτό το θέμα έχει αρχειοθετηθεί και είναι κλειστό για περαιτέρω απαντήσεις.

  • Δημιουργία νέου...