pirmen56 Δημοσ. 1 Φεβρουαρίου 2020 Δημοσ. 1 Φεβρουαρίου 2020 Στις 30/1/2020 στις 3:06 ΜΜ, masteripper είπε Επειδή πολλά έχουν ακουστεί για τον 1 από τους προαναφερθέντες "καπαδόκκες" όσον αφορά μισθούς και μεταχείριση υπαλλήλων (όχι αυτά που σερβίρουν στα διάφορα Media) το θεωρώ λίγο απίθανο το Azure να κάνει τόσο τρομακτικά καλή δουλειά....πιο πιθανόν να βάζουν 1 "σκλαβάκι" να κάνει οπτικό έλεγχο σε όσα επέστρεψε το Azure με χαμηλό βαθμό αναγνώρισης.... Ορίστε και 1 δείγμα απο εταιρεία που υποτίθεται ειδικεύεται σε χειρόγραφα τιμολόγια https://nanonets.com/blog/invoice-ocr/ Μου αρέσει που κάνουν και επίδειξη και βγαίνουν τα ποσά άλλα ντ'αλλων...τρελλή επιτυχία. Αυτό που λες είναι το πιθανότερο. Κατά την αναγνώριση στοιχείων τιμολογίων(αν φυσικά δεν υπάρχει απόλυτη ομοιομορφία και καθαρή γραφή) οι άνθρωποι επιστρατεύουν και την κοινή τους λογική. Την γενικότερη εμπειρία τους από την ζωή. Πληροφορίες που δεν υπάρχουν πάνω στο έγγραφο. Συνδυασμός γνώσεων από πολλές διαφορετικές πηγές. Π.χ. η ανθρώπινη κρίση σου λέει ότι ένα τιμολόγιο που αφορά μια κάρτα ήχου δεν μπορεί να αναγράφει ποσό 30.000€ και το πιθανότερο είναι να έχει γίνει λάθος(τέλεια μετά το 30 αντί για κόμμα που είναι το σωστό και 3 μηδενικά αντί για 2). Ή ότι το ΦΠΑ δεν μπορεί να είναι μεγαλύτερο από την αξία του αγαθού αν έχει γίνει κάποιο λάθος στην εκτύπωση των γραμμών.
solution1 Δημοσ. 1 Φεβρουαρίου 2020 Δημοσ. 1 Φεβρουαρίου 2020 (επεξεργασμένο) Πραγματικά απορώ, γιατί δεν επιβάλλει η Ευρώπη μία καθολική φόρμα, τύπου Europass.. Κάθονται και ασχολούνται με κοινά βύσματα φόρτισης, αντί να ασχοληθούνε με σοβαρά θέματα. Εάν όλα τα τιμολόγια είχαν ακριβώς την ίδια διάταξη, θα μπορούσαμε να περάσουμε τα στοιχεια τους με ένα απλό OCR, χωρίς καν να χρησιμοποιηθεί machine learning. Είναι τρέλα αυτό που γίνεται! Ο καθένας έχει το δικό του format. Δεν είναι δύσκολο να γίνει. Για αρχή, θα σταματήσει να δέχεται τιμολόγια πλην του δικού της format για όλα τα Ευρωπαϊκά έργα. Κοινώς, εάν θέλεις να πληρωθείς, θα ΠΡΕΠΕΙ να χρησιμοποιήσεις συγκεκριμένη φόρμα. Από συνδετήρες, μέχρι εξοπλισμό για το CERN. Αν αρχίσουν να το χρησιμοποιoύν οι "μεγάλοι" σε λίγο καιρό, θα το υιοθετήσουν και οι μικροί. Επεξ/σία 3 Φεβρουαρίου 2020 από solution1
randomcat Δημοσ. 1 Φεβρουαρίου 2020 Δημοσ. 1 Φεβρουαρίου 2020 Στις 30/1/2020 στις 11:24 ΠΜ, patclo είπε Είναι εύκολο να πάρει κάποιος μια έτοιμη βιβλιοθήκη και σε δέκα λεπτά να φτιάξει ένα πρόγραμμα που σκανάρει χιλιάδες τιμολόγια και εξάγει τα νούμερα από μέσα για να τα πετάξει μετά κατηγοριοποιημένα σε ένα csv file για το excel αλλά αν έστω και ένα στα εκατό παίζει να αναγνωριστεί λάθος τότε είναι δώρο άδωρον. Ρε συ δεν νομίζεις ότι υπερβάλλεις κάπως; Πάνω από 10 δευτερόλεπτα δεν χρειάζονται για την κατασκευή κάτι τέτοιου. Με 10 ολόκληρα λεπτά αν είσαι έμπειρος προγραμματιστής φτιάχνεις ολόκληρη custom λύση χωρίς έτοιμη βιβλιοθήκη, η οποία θα τακτοποιεί το 99% των παραστατικών - αν και αν μιλάμε για 100% επιτυχία νομίζω ότι η μισή ώρα είναι απαραίτητη. 2
pmav99 Δημοσ. 3 Φεβρουαρίου 2020 Δημοσ. 3 Φεβρουαρίου 2020 (επεξεργασμένο) αν θέλει κανείς να πάρει ιδέες: https://nanonets.com/blog/receipt-ocr/ Επεξ/σία 3 Φεβρουαρίου 2020 από pmav99
patclo Δημοσ. 3 Φεβρουαρίου 2020 Δημοσ. 3 Φεβρουαρίου 2020 (επεξεργασμένο) Δυστυχώς το πιθανότερο είναι ότι στο τέλος ο προγραμματιστής θα αγοράσει χρήση μιας επί πληρωμής βιβλιοθήκης με είσοδο τα έγγραφα και έξοδο τις αναγνωρισμένες τιμές και θα βάλει ένα καπέλο για να βγάλει κέρδος από τον πελάτη του. Δύσκολο έως αδύνατο να έχουν φτιάξει κάτι που έκανε καλύτερη δουλειά βασιζόμενοι μόνο στο tesseract/Magickimage και γράφοντας κατεβατά δικού τους κώδικα για πασάλειμμα που θα το κάνει "έξυπνο" να χειρίζεται όλες τις περιπτώσεις ποιότητας σκαναρίσματος/μορφής τιμολογίου όπως οι επαγγελματικές λύσεις . Δεν θα αγόραζε η epsilon net από το azure ή τέλος πάντων θα διαφήμιζαν ανοικτά την τεχνολογία τους πχ https://rossum.ai/ για να δούμε τι ψάρια πιάνει. Από εκεί και πέρα αν έχεις τα πολύ καλοσκαναρισμένα ομοιόμορφα τιμολόγια με συγκεκριμένη θέση των πεδίων που πρέπει να διαβάσεις τότε ναι δεν παίρνει καθόλου χρόνο να το φτιάξεις με tesseract. Επεξ/σία 3 Φεβρουαρίου 2020 από patclo
tasanton Δημοσ. 10 Φεβρουαρίου 2020 Δημοσ. 10 Φεβρουαρίου 2020 Επειδή γράφονται διάφορα "εξωτικά", δεν υπάρχει αυτή τη στιγμή πρόγραμμα/υπηρεσία που να αναγνωρίζει 100% παντός μορφής τιμολόγια. Όποιος σας υπόσχεται κάτι τέτοιο, προσοχή. Αυτό που παρέχεται είναι συνδυασμένη υπηρεσία + λογισμικό (π.χ. σαν αυτό που δίνει η Datacomm, όπως και άλλες). Συνεπώς η σωστή ερώτηση θα ήταν: ποια από τις εμπορικά διαθέσιμες υπηρεσίες ή λογισμικό δίνει το μικρότερο περιθώριο σφάλματος (ή αντίστροφα, την πιο πιστή αποτύπωση δεδομένων); Διότι με χρήματα και νούμερα δεν παίζεις.
Προτεινόμενες αναρτήσεις
Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε
Πρέπει να είστε μέλος για να αφήσετε σχόλιο
Δημιουργία λογαριασμού
Εγγραφείτε με νέο λογαριασμό στην κοινότητα μας. Είναι πανεύκολο!
Δημιουργία νέου λογαριασμούΣύνδεση
Έχετε ήδη λογαριασμό; Συνδεθείτε εδώ.
Συνδεθείτε τώρα