Προς το περιεχόμενο

Προτεινόμενες αναρτήσεις

Δημοσ.

Καλησπέρα,

 Έχω ένα αρχείο txt που περιλαμβάνει γύρω στις 600.000 ελληνικές λέξεις ( νομίζω το βρήκα από κάποιον "άγιο" εδώ μέσα κιόλας για αυτό φαντάστηκα ότι αν μπορώ να βρω κάπου βοήθεια στο πρόβλημα μου, λογικά θα είναι εδώ ). Το πρόβλημα είναι ότι χρειάζομαι να μετατρέψω όλες τις λέξεις σε κεφαλαία και να αφαιρεθούν οι τόνοι και τα διαλυτικά. Υπάρχει κάποιος τρόπος να το κάνω χωρίς να γεράσω στην προσπάθεια ;

Ευχαριστώ εκ των προτέρων

Δημοσ. (επεξεργασμένο)

Αυτό γίνεται με έναν σύγχρονο επεξεργαστή κειμένου. Π.χ. στο Word 2013 που χρησιμοποιώ: ανοίγουμε το έγγραφο, επιλέγουμε το κείμενο που θέλουμε και πατάμε Shift+F3 → μετατρέπονται όλα σε κεφαλαία. Φαντάζομαι ότι εν επιλέξεις όλο το κείμενο των 600000 λέξεων η μετατροπή θα γίνει χωρίς πρόβλημα, αν και ίσως με κάποια καθυστέρηση (δεν το έχω κάνει ποτέ σε τόσο μεγάλο κείμενο).
Στη συνέχεια, για την αντικατάσταση των τονούμενων κεφαλαίων με άτονα (και όσων έχουν διαλυτικά με φωνήεντα χωρίς διαλυτικά), χρησιμοποιούμε την Εύρεση και Αντικατάσταση (Control+H). Συνολικά θα γίνουν εφτά αντικαταστάσεις (για τα φωνήεντα με τόνους) και δύο για τα φωνήεντα με διαλυτικά (Ϋ, Ϊ).

Επεξ/σία από accipio
  • Thanks 1
Δημοσ.
52 λεπτά πριν, accipio είπε

Αυτό γίνεται με έναν σύγχρονο επεξεργαστή κειμένου. Π.χ. στο Word 2013 που χρησιμοποιώ: ανοίγουμε το έγγραφο, επιλέγουμε το κείμενο που θέλουμε και πατάμε Shift+F3 → μετατρέπονται όλα σε κεφαλαία. Φαντάζομαι ότι εν επιλέξεις όλο το κείμενο των 600000 λέξεων η μετατροπή θα γίνει χωρίς πρόβλημα, αν και ίσως με κάποια καθυστέρηση (δεν το έχω κάνει ποτέ σε τόσο μεγάλο κείμενο).
Στη συνέχεια, για την αντικατάσταση των τονούμενων κεφαλαίων με άτονα (και όσων έχουν διαλυτικά με φωνήεντα χωρίς διαλυτικά), χρησιμοποιούμε την Εύρεση και Αντικατάσταση (Control+H). Συνολικά θα γίνουν εφτά αντικαταστάσεις (για τα φωνήεντα με τόνους) και δύο για τα φωνήεντα με διαλυτικά (Ϋ, Ϊ).

Είσαι μεγάλος μάστορας.

Τελικά στο word του 365 ήθελε απλά να πατήσω shift + F3 και έγινε όλη η δουλειά που ήθελα αυτόματα ( δεν χρειάστηκε η διαδικασία με την Εύρεση και Αντικατάσταση ). Βέβαια πήρε γύρω στο μισάωρο να το κάνει το Word γιατί τα έπαιξε και κόλλησε, αλλά το έκανε. Σε ευχαριστώ πάρα πολύ, ήμουν πεπεισμένος ότι θα χρειαζόταν να κάτσω να γράψω πρόγραμμα σε python να μου κάνει την δουλειά και από python δεν σκαμπάζω γρι, τελικά χρειαζόταν απλά ένα shortcut στο word 😂

Σε ευχαριστώ και πάλι δεν μπορείς να φανταστείς τι δουλειά μου γλίτωσες !

Δημοσ. (επεξεργασμένο)
12 λεπτά πριν, kdimitrisk είπε

Σε ευχαριστώ πάρα πολύ, ήμουν πεπεισμένος ότι θα χρειαζόταν να κάτσω να γράψω πρόγραμμα σε python να μου κάνει την δουλειά και από python δεν σκαμπάζω γρι, τελικά χρειαζόταν απλά ένα shortcut στο word 😂

Και γιατί python και όχι VB, που συνεργάζεται και με την σουίτα της Microsoft και είναι και πολύ πιο φιλική στον αρχάριο χρήστη; Σκεφτείτε το την επόμενη φορά και θα με θυμηθείτε 😉

Επεξ/σία από MauroPaltoudias
Δημοσ. (επεξεργασμένο)
5 ώρες πριν, accipio είπε

Συνολικά θα γίνουν εφτά αντικαταστάσεις (για τα φωνήεντα με τόνους) και δύο για τα φωνήεντα με διαλυτικά (Ϋ,

Ξέχασες τα διαλυτικά με τόνους (ΰ, ΐ) ! ;)

Επεξ/σία από micos000
Δημοσ.
4 λεπτά πριν, micos000 είπε

Ξέχασες τα διαλυτικά με τόνους (ΰ, ΐ) ! ;)

Σωστά! Το σκέφτηκα μετά, αλλά βαρέθηκα να το προσθέσω στο μήνυμά μου - άλλωστε είναι πολύ σπάνιες περιπτώσεις. Μόνο το Μαΐου είναι ίσως το πιο συχνό.
Και κάτι άσχετο αλλά και σχετικό: από περιέργεια άνοιξα ένα από τα μεγαλύτερα έγγραφα docx που έχω: 1151 σελίδες Α4, αρκετά πυκνογραμμένες, με TimesNewRoman 11, διάστιχο 1, περιθώρια 2,5 εκ. Σύνολο λέξων: 565854 - αρκετά κοντά στις 600000 λέξεις.

Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε

Πρέπει να είστε μέλος για να αφήσετε σχόλιο

Δημιουργία λογαριασμού

Εγγραφείτε με νέο λογαριασμό στην κοινότητα μας. Είναι πανεύκολο!

Δημιουργία νέου λογαριασμού

Σύνδεση

Έχετε ήδη λογαριασμό; Συνδεθείτε εδώ.

Συνδεθείτε τώρα
  • Δημιουργία νέου...