givekos Δημοσ. 22 Σεπτεμβρίου 2021 Δημοσ. 22 Σεπτεμβρίου 2021 Καλησπέρα σας , αντιμετωπίζω το εξής θέμα : Έχουμε 2 αρχεία Εxcel με 19 columns το καθένα , 1 μεγάλο αρχείο και 1 μικρό αρχείο , στο οποίο μικρό εμπεριέχονται το 10% των data από το μεγάλο. Το μεγάλο αρχείο έχει 40 χιλιάδες data και το μικρό έχει 4 χιλιάδες. Αυτό που χρειάζομαι είναι να αφαιρέσω όλα τα δεδομένα που εμπεριέχονται στο μικρό αρχείο (τα 4 χιλιάδες δηλαδή) από το μεγάλο αρχείο (από τα 40 χιλιάδες δηλαδή). Επομένως να μείνουν στο μεγάλο αρχείο 36 χιλιάδες δεδομένα , έχοντας αφαιρέσει όμως τα συγκεκριμένα 4 χιλιάδες που έχει το μικρό αρχείο. Να σημειώσω ότι καμία στήλη δεν μπορεί να θεωρηθεί ως μοναδική έτσι ώστε να κάνω vlookup. Παρακαλώ για τη βοήθειά σας , πως μπορεί να γίνει κάτι τέτοιο?
NikosKallithea Δημοσ. 22 Σεπτεμβρίου 2021 Δημοσ. 22 Σεπτεμβρίου 2021 Δεν νομιζω να γίνεται αυτο αν δεν εισαι προγραμματιστής, να υποθεσω εννοείς διπλότυπες εγγραφές που εμπεριέχονται και στο μικρο και στο μεγάλο.
archer100 Δημοσ. 22 Σεπτεμβρίου 2021 Δημοσ. 22 Σεπτεμβρίου 2021 (επεξεργασμένο) Μπορει να γινει σχετικα ευκολα με Python Ειναι οι στηλες (τα ονοματα) ακριβως ομοιες και στα 2 αρχεια; Επισης οι 4000 γραμμες ειναι ακριβως ομοιες και στα 2, τοσο ως προς τα δεδομενα οσο και ως προ τον τυπο των δεδομενων (πχ να ειναι και στα 2 αρχεια στην ιδια στηλη 102.5 και οχι 102.5 και 102.500001, οπως και να ειναι και στα 2 100 και οχι 100 και "100"); Αν ναι, στειλε μου τα αρχεια με https://wetransfer.com/ η με ποιον αλλον τροπο σε βολευει και θα στο κανω. Διαφορετικα, αν μπορεις να τρεξεις Python κωδικα με καποιον τροπο, πες μου να σου στειλω απλα τον κωδικα Επεξ/σία 22 Σεπτεμβρίου 2021 από archer100
masteripper Δημοσ. 22 Σεπτεμβρίου 2021 Δημοσ. 22 Σεπτεμβρίου 2021 Καντο Linked στην Access....κανε 1 Local πίνακα απο τον Linked...κανε το Manipulation...export σε Excel...finito
Lanike71 Δημοσ. 22 Σεπτεμβρίου 2021 Δημοσ. 22 Σεπτεμβρίου 2021 (επεξεργασμένο) Αυτό βοηθάει; How to merge sheets into one and remove the duplicates in Excel? (extendoffice.com) Δεν ξέρω ταχύτητα εκτέλεσης όμως λόγω μεγεθών. Αλλιώς θα πήγαινα προγραμματιστικά, αφού τα έκανα csv πρώτα. Επεξ/σία 22 Σεπτεμβρίου 2021 από Lanike71
archer100 Δημοσ. 22 Σεπτεμβρίου 2021 Δημοσ. 22 Σεπτεμβρίου 2021 9 λεπτά πριν, Lanike71 είπε Αυτό βοηθάει; How to merge sheets into one and remove the duplicates in Excel? (extendoffice.com) Δεν ξέρω ταχύτητα εκτέλεσης όμως λόγω μεγεθών. Αλλιώς θα πήγαινα προγραμματιστικά, αφού τα έκανα csv πρώτα. Δεν ειναι αυτο που ζηταει ο νηματοθετης. Αυτο που προτεινεις αφαιρει τα duplicates, ενω ο νηματοθετης θελει ολικη αφαιρεση γραμμων που βρισκονται σε αλλο sheet, ειναι τελειως διαφορετικο 1
MastroGiannis Δημοσ. 23 Σεπτεμβρίου 2021 Δημοσ. 23 Σεπτεμβρίου 2021 12 ώρες πριν, givekos είπε Καλησπέρα σας , αντιμετωπίζω το εξής θέμα : Έχουμε 2 αρχεία Εxcel με 19 columns το καθένα , 1 μεγάλο αρχείο και 1 μικρό αρχείο , στο οποίο μικρό εμπεριέχονται το 10% των data από το μεγάλο. Το μεγάλο αρχείο έχει 40 χιλιάδες data και το μικρό έχει 4 χιλιάδες. Αυτό που χρειάζομαι είναι να αφαιρέσω όλα τα δεδομένα που εμπεριέχονται στο μικρό αρχείο (τα 4 χιλιάδες δηλαδή) από το μεγάλο αρχείο (από τα 40 χιλιάδες δηλαδή). Επομένως να μείνουν στο μεγάλο αρχείο 36 χιλιάδες δεδομένα , έχοντας αφαιρέσει όμως τα συγκεκριμένα 4 χιλιάδες που έχει το μικρό αρχείο. Να σημειώσω ότι καμία στήλη δεν μπορεί να θεωρηθεί ως μοναδική έτσι ώστε να κάνω vlookup. Παρακαλώ για τη βοήθειά σας , πως μπορεί να γίνει κάτι τέτοιο? Γίνεται εύκολα με τη χρήση δύο βοηθητικών στηλών. Αρχικά αντιγράφεις τις 4k γραμμές κάτω από τις 40k αλλά με κενό τουλάχιστον μιας γραμμής. Στην 20η στήλη και του μικρού και του μεγάλου πίνακα(ονόμασέ τη ID), συνενώνεις όλες τις τιμές από τα 19 κελιά κάθε γραμμής σε ένα με τη συνάρτηση CONCATENATE. Για παράδειγμα: =CONCATENATE(Α2;Β2;C2;…S2). Έτσι έχεις το «αναγνωριστικό» της κάθε γραμμής. Στην 21η στήλη του μεγάλου πίνακα (ονόμασέ τη Count), καταμετράς τις εμφανίσεις κάθε τιμής της στήλης ID στην αντίστοιχη στήλη του μικρού πίνακα με τη συνάρτηση COUNTIF. Για παράδειγμα, στο κελί U2 εισάγεις τον τύπο: =COUNTIF($T$40003:$T$44002;T2) και συμπληρώνεις προς τα κάτω. Εφαρμόζεις αυτόματο φίλτρο στο μεγάλο πίνακα και φιλτράρεις με βάση τη στήλη "Count" κρύβοντας τις γραμμές με count μηδέν. Διαγράφεις όσες γραμμές εμφανίζονται μετά από το φίλτρο. Αφαιρείς το αυτόματο φίλτρο και, αν θέλεις, τις βοηθητικές στήλες και το μικρό πίνακα. Εννοείται ότι πριν απ’ όλα κρατάς back-up του αρχικού αρχείου. Υ.Γ.: Στη συνένωση με την CONCATENATE, περιλαμβάνεις όσες στήλες πιστεύεις ότι δημιουργούν ένα επαρκές «αναγνωριστικό». Ίσως να μη χρειάζονται και οι 19. 1
Προτεινόμενες αναρτήσεις
Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε
Πρέπει να είστε μέλος για να αφήσετε σχόλιο
Δημιουργία λογαριασμού
Εγγραφείτε με νέο λογαριασμό στην κοινότητα μας. Είναι πανεύκολο!
Δημιουργία νέου λογαριασμούΣύνδεση
Έχετε ήδη λογαριασμό; Συνδεθείτε εδώ.
Συνδεθείτε τώρα