Προς το περιεχόμενο

Δυναμική Δημιουργία keyword


Xdanger

Προτεινόμενες αναρτήσεις

Δημοσ.

Θέλω σε μια σελίδα που φτιάχνω σε κάθε κείμενο που αναρτάται να δημιουργούνται αυτόματα keywords.

Έχω σκεφτεί από το κείμενο να εξάγω τα ουσιαστικά και να βάζω ως keyword τα 3-4 από αυτά που εμφανίζονται ποιο συχνά αλλά πριν αρχίσω το διάβασμα φιλολογικών βιβλίων για να δω πως θα ξεχωρίσω τα ουσιαστικά από τις υπόλοιπες λέξεις μήπως ξέρει κανείς αν υπάρχει κάποιος ποιο εύκολος τρόπος ή και κάτι έτοιμο για να μην ξανά-ανακαλύπτω τον τροχό.

Δημοσ.

Τα ουσιαστικά θα μπορούσες να τα βρεις ψάχνοντας για ό,τι ξεκινάει με "ο", "η", "το" κτλ (ή με "the" για τα αγγλικά), αλλά σαν ιδέα μου φαίνεται εντελώς λάθος. Το πιο πιθανό είναι πως το τέλος όλα σου τα άρθρα θα χαρακτηρίζονται από τα ίδια και τα ίδια keywords

Δημοσ.

Δεν μου έρχεται καμιά καλύτερη ιδέα γιαυτό ζήτησα βοήθεια.

 

Η σκέψη μου είναι ότι το νόημα μιας πρότασης βρίσκεται στα ουσιαστικά και τα υπόλοιπα μέρη του λόγου χρησιμοποιούνται βοηθητικά.

Πάντως με αυτή την λογική χρειάζεται πολύ διάβασμα γιατί εκτός από την αναγνώριση των ουσιαστικών χρειάζεται να βρω ποια ουσιαστικά δεν δίνουν κάποιο νόημα + δεν ξέρω τι άλλο μπορεί να προκύψει.

 

Λογικά κάτι άλλο δεν θα υπάρχει? δεν βρίσκω κάτι αλλά δεν νομίζω να είμαι ο πρώτος που σκέφτηκα να το κάνω

Δημοσ.

Φυσικά και υπάρχει άλλη λύση: χειροκίνητα! Δε πιστεύω ότι θα είναι τόσο μεγάλος ο όγκος των άρθρων που θα δημοσιεύεις, ώστε να πρέπει να γίνεται αυτόματα αυτή η ιστορία.

Κάτι άλλο που μου έρχεται στο μυαλό, είναι να θέσεις εσύ 20-30 βασικά keywords και σε κάθε ένα από αυτά να αντιστοιχείς ένα πλήθος λέξεων - για παράδειγμα, στο keyword "υπολογιστές" μπορείς να αντιστοιχίσεις τις λέξεις "οθόνη", "πληκτρολόγιο", "ποντίκι" κοκ. Μόλις βρεις στο κείμενο μία από αυτές τις λέξεις, του ορίζεις και το αντίστοιχο keyword

Δημοσ.

Είναι λίγο περιέργο αυτό που θέλω να φτιάξω, βασικά δεν θα ανεβάζω άρθρα, αλλά θα ανεβαίνουν γύρω στα 400-700 κείμενα την ημέρα αυτοματοποιημένα και θα πρέπει να βγαίνουν και τα tags αυτόματα για να μπορώ να τα κατηγοριοποιήσω και να αξιολογήσω αν θα πρέπει να εμφανίζονται ή όχι ή σε ποιους θα εμφανίζονται κτλπ.

Δημοσ.

γενικά χρειάζεσαι τεχνικές Natural Language Processing/ Computational linguistics ...

άρχισε από εδώ: http://en.wikipedia.org/wiki/Stemming και http://en.wikipedia.org/wiki/Part-of-speech_tagging

 

γενικά αυτό που θες να φτιάξεις έχει δουλειά, όπως θα καταλάβεις σύντομα...(αν δεν το έχεις αντιληφθεί ήδη δηλαδή)

 

καλή συνέχεια...

Δημοσ.

το χω καταλάβει, και το μεγαλύτερο πρόβλημα είναι ότι θα είναι ελληνικά τα κείμενα οπότε η βιβλιογραφία είναι περιορισμένη.

ευχαριστώ πολύ για τις απαντήσεις σας

Αρχειοθετημένο

Αυτό το θέμα έχει αρχειοθετηθεί και είναι κλειστό για περαιτέρω απαντήσεις.

  • Δημιουργία νέου...