Xdanger Δημοσ. 6 Φεβρουαρίου 2011 Δημοσ. 6 Φεβρουαρίου 2011 Θέλω σε μια σελίδα που φτιάχνω σε κάθε κείμενο που αναρτάται να δημιουργούνται αυτόματα keywords. Έχω σκεφτεί από το κείμενο να εξάγω τα ουσιαστικά και να βάζω ως keyword τα 3-4 από αυτά που εμφανίζονται ποιο συχνά αλλά πριν αρχίσω το διάβασμα φιλολογικών βιβλίων για να δω πως θα ξεχωρίσω τα ουσιαστικά από τις υπόλοιπες λέξεις μήπως ξέρει κανείς αν υπάρχει κάποιος ποιο εύκολος τρόπος ή και κάτι έτοιμο για να μην ξανά-ανακαλύπτω τον τροχό.
dewn735 Δημοσ. 6 Φεβρουαρίου 2011 Δημοσ. 6 Φεβρουαρίου 2011 Τα ουσιαστικά θα μπορούσες να τα βρεις ψάχνοντας για ό,τι ξεκινάει με "ο", "η", "το" κτλ (ή με "the" για τα αγγλικά), αλλά σαν ιδέα μου φαίνεται εντελώς λάθος. Το πιο πιθανό είναι πως το τέλος όλα σου τα άρθρα θα χαρακτηρίζονται από τα ίδια και τα ίδια keywords
Xdanger Δημοσ. 8 Φεβρουαρίου 2011 Μέλος Δημοσ. 8 Φεβρουαρίου 2011 Δεν μου έρχεται καμιά καλύτερη ιδέα γιαυτό ζήτησα βοήθεια. Η σκέψη μου είναι ότι το νόημα μιας πρότασης βρίσκεται στα ουσιαστικά και τα υπόλοιπα μέρη του λόγου χρησιμοποιούνται βοηθητικά. Πάντως με αυτή την λογική χρειάζεται πολύ διάβασμα γιατί εκτός από την αναγνώριση των ουσιαστικών χρειάζεται να βρω ποια ουσιαστικά δεν δίνουν κάποιο νόημα + δεν ξέρω τι άλλο μπορεί να προκύψει. Λογικά κάτι άλλο δεν θα υπάρχει? δεν βρίσκω κάτι αλλά δεν νομίζω να είμαι ο πρώτος που σκέφτηκα να το κάνω
dewn735 Δημοσ. 8 Φεβρουαρίου 2011 Δημοσ. 8 Φεβρουαρίου 2011 Φυσικά και υπάρχει άλλη λύση: χειροκίνητα! Δε πιστεύω ότι θα είναι τόσο μεγάλος ο όγκος των άρθρων που θα δημοσιεύεις, ώστε να πρέπει να γίνεται αυτόματα αυτή η ιστορία. Κάτι άλλο που μου έρχεται στο μυαλό, είναι να θέσεις εσύ 20-30 βασικά keywords και σε κάθε ένα από αυτά να αντιστοιχείς ένα πλήθος λέξεων - για παράδειγμα, στο keyword "υπολογιστές" μπορείς να αντιστοιχίσεις τις λέξεις "οθόνη", "πληκτρολόγιο", "ποντίκι" κοκ. Μόλις βρεις στο κείμενο μία από αυτές τις λέξεις, του ορίζεις και το αντίστοιχο keyword
Xdanger Δημοσ. 8 Φεβρουαρίου 2011 Μέλος Δημοσ. 8 Φεβρουαρίου 2011 Είναι λίγο περιέργο αυτό που θέλω να φτιάξω, βασικά δεν θα ανεβάζω άρθρα, αλλά θα ανεβαίνουν γύρω στα 400-700 κείμενα την ημέρα αυτοματοποιημένα και θα πρέπει να βγαίνουν και τα tags αυτόματα για να μπορώ να τα κατηγοριοποιήσω και να αξιολογήσω αν θα πρέπει να εμφανίζονται ή όχι ή σε ποιους θα εμφανίζονται κτλπ.
Επισκέπτης Δημοσ. 8 Φεβρουαρίου 2011 Δημοσ. 8 Φεβρουαρίου 2011 γενικά χρειάζεσαι τεχνικές Natural Language Processing/ Computational linguistics ... άρχισε από εδώ: http://en.wikipedia.org/wiki/Stemming και http://en.wikipedia.org/wiki/Part-of-speech_tagging γενικά αυτό που θες να φτιάξεις έχει δουλειά, όπως θα καταλάβεις σύντομα...(αν δεν το έχεις αντιληφθεί ήδη δηλαδή) καλή συνέχεια...
Xdanger Δημοσ. 9 Φεβρουαρίου 2011 Μέλος Δημοσ. 9 Φεβρουαρίου 2011 το χω καταλάβει, και το μεγαλύτερο πρόβλημα είναι ότι θα είναι ελληνικά τα κείμενα οπότε η βιβλιογραφία είναι περιορισμένη. ευχαριστώ πολύ για τις απαντήσεις σας
Προτεινόμενες αναρτήσεις
Αρχειοθετημένο
Αυτό το θέμα έχει αρχειοθετηθεί και είναι κλειστό για περαιτέρω απαντήσεις.