pmav99 Δημοσ. 14 Δεκεμβρίου 2018 Δημοσ. 14 Δεκεμβρίου 2018 14 λεπτά πριν, Eru Iluvatar είπε BTW, με τους πάρσερς μπορείς να κάνεις extract μια ολόκληρη παράγραφο στην οποία υπάρχουν κάποιες λέξεις κλειδιά; Απλά για να το έχεις στο νου σου, οι filers υποβάλουν και Amendments (διορθώσεις). Κάποιες φορές υπάρχουν περισσότερες από μία διορθώσεις. Για να βγάλεις άκρη με τα amendments, χρειάζεσαι και τα metadata του filing (ημερομηνίες κτλ) όχι μόνο τα δεδομενα. Επίσης αν χρειάζεσαι απλά ορισμένες εταιρείες, η δουλειά σου είναι σχετικά εύκολη. Αν θες όλο το market, ανάλογα και με το τι δεδομένα χρειάζεσαι μπορεί να είναι και μήνες δουλειάς.
Eru Iluvatar Δημοσ. 14 Δεκεμβρίου 2018 Μέλος Δημοσ. 14 Δεκεμβρίου 2018 Μόλις τώρα, kaliakman είπε Επειδή δεν έχω καταλάβει αν είσαι σε windows : αν εισαι σε unix είναι παρά πολύ εύκολο να το κάνεις με shell script. Βρίσεις το start html tag και κρατάς γραμμές μέχρι να βρεις το ending html tag. Το output το βγάζεις σε αρχείο που θέλεις. Με άλλα λόγια grep και regex is the way to go. Eίμαι σε Windows 10. ΟΚ θα κοιταξω αυτά που λες. Όπως είπα και παραπάνω θα ήθελα να βγάλω όλη την παράγραφο που έχει λέξεις κλειδιά μέσα γιατί πρέπει να διαβάσω πληροφορίες από εκεί. 2 λεπτά πριν, pmav99 είπε Απλά για να το έχεις στο νου σου, οι filers υποβάλουν και Amendments (διορθώσεις). Κάποιες φορές υπάρχουν περισσότερες από μία διορθώσεις. Για να βγάλεις άκρη με τα amendments, χρειάζεσαι και τα metadata του filing (ημερομηνίες κτλ) όχι μόνο τα δεδομενα. Επίσης αν χρειάζεσαι απλά ορισμένες εταιρείες, η δουλειά σου είναι σχετικά εύκολη. Αν θες όλο το market, ανάλογα και με το τι δεδομένα χρειάζεσαι μπορεί να είναι και μήνες δουλειάς. Ευτυχώς είναι κάποιες εκατοντάδες εταιρείς μόνο.
Προτεινόμενες αναρτήσεις
Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε
Πρέπει να είστε μέλος για να αφήσετε σχόλιο
Δημιουργία λογαριασμού
Εγγραφείτε με νέο λογαριασμό στην κοινότητα μας. Είναι πανεύκολο!
Δημιουργία νέου λογαριασμούΣύνδεση
Έχετε ήδη λογαριασμό; Συνδεθείτε εδώ.
Συνδεθείτε τώρα