Προς το περιεχόμενο

Προτεινόμενες αναρτήσεις

Δημοσ.

Καλησπέρα σας , αντιμετωπίζω το εξής θέμα : Έχουμε 2 αρχεία Εxcel με 19 columns το καθένα , 1 μεγάλο αρχείο και 1 μικρό αρχείο , στο οποίο μικρό εμπεριέχονται το 10% των data από το μεγάλο. Το μεγάλο αρχείο έχει 40 χιλιάδες data και το μικρό έχει 4 χιλιάδες. Αυτό που χρειάζομαι είναι να αφαιρέσω όλα τα δεδομένα που εμπεριέχονται στο μικρό αρχείο (τα 4 χιλιάδες δηλαδή) από το μεγάλο αρχείο (από τα 40 χιλιάδες δηλαδή). Επομένως να μείνουν στο μεγάλο αρχείο 36 χιλιάδες δεδομένα , έχοντας αφαιρέσει όμως τα συγκεκριμένα 4 χιλιάδες που έχει το μικρό αρχείο. Να σημειώσω ότι καμία στήλη δεν μπορεί να θεωρηθεί ως μοναδική έτσι ώστε να κάνω vlookup. Παρακαλώ για τη βοήθειά σας , πως μπορεί να γίνει κάτι τέτοιο?

Δημοσ.

Δεν νομιζω να γίνεται αυτο αν δεν εισαι προγραμματιστής, να υποθεσω εννοείς διπλότυπες εγγραφές που εμπεριέχονται και στο μικρο και στο μεγάλο.

Δημοσ. (επεξεργασμένο)

Μπορει να γινει σχετικα ευκολα με Python

Ειναι οι στηλες (τα ονοματα) ακριβως ομοιες και στα 2 αρχεια;

Επισης οι 4000 γραμμες ειναι ακριβως ομοιες και στα 2, τοσο ως προς τα δεδομενα οσο και ως προ τον τυπο των δεδομενων (πχ να ειναι και στα 2 αρχεια στην ιδια στηλη 102.5 και οχι 102.5 και 102.500001, οπως και να ειναι και στα 2 100 και οχι 100 και "100");

Αν ναι, στειλε μου τα αρχεια με https://wetransfer.com/ η με ποιον αλλον τροπο σε βολευει και θα στο κανω. 

Διαφορετικα, αν μπορεις να τρεξεις Python κωδικα με καποιον τροπο, πες μου να σου στειλω απλα τον κωδικα

Επεξ/σία από archer100
Δημοσ. (επεξεργασμένο)

Αυτό βοηθάει;

How to merge sheets into one and remove the duplicates in Excel? (extendoffice.com)

Δεν ξέρω ταχύτητα εκτέλεσης όμως λόγω μεγεθών.

Αλλιώς θα πήγαινα προγραμματιστικά, αφού τα έκανα csv πρώτα.

Επεξ/σία από Lanike71
Δημοσ.
9 λεπτά πριν, Lanike71 είπε

Αυτό βοηθάει;

How to merge sheets into one and remove the duplicates in Excel? (extendoffice.com)

Δεν ξέρω ταχύτητα εκτέλεσης όμως λόγω μεγεθών.

Αλλιώς θα πήγαινα προγραμματιστικά, αφού τα έκανα csv πρώτα.

Δεν ειναι αυτο που ζηταει ο νηματοθετης. Αυτο που προτεινεις αφαιρει τα duplicates, ενω ο νηματοθετης θελει ολικη αφαιρεση γραμμων που βρισκονται σε αλλο sheet, ειναι τελειως διαφορετικο

  • Thanks 1
Δημοσ.
12 ώρες πριν, givekos είπε

Καλησπέρα σας , αντιμετωπίζω το εξής θέμα : Έχουμε 2 αρχεία Εxcel με 19 columns το καθένα , 1 μεγάλο αρχείο και 1 μικρό αρχείο , στο οποίο μικρό εμπεριέχονται το 10% των data από το μεγάλο. Το μεγάλο αρχείο έχει 40 χιλιάδες data και το μικρό έχει 4 χιλιάδες. Αυτό που χρειάζομαι είναι να αφαιρέσω όλα τα δεδομένα που εμπεριέχονται στο μικρό αρχείο (τα 4 χιλιάδες δηλαδή) από το μεγάλο αρχείο (από τα 40 χιλιάδες δηλαδή). Επομένως να μείνουν στο μεγάλο αρχείο 36 χιλιάδες δεδομένα , έχοντας αφαιρέσει όμως τα συγκεκριμένα 4 χιλιάδες που έχει το μικρό αρχείο. Να σημειώσω ότι καμία στήλη δεν μπορεί να θεωρηθεί ως μοναδική έτσι ώστε να κάνω vlookup. Παρακαλώ για τη βοήθειά σας , πως μπορεί να γίνει κάτι τέτοιο?

Γίνεται εύκολα με τη χρήση δύο βοηθητικών στηλών.

Αρχικά αντιγράφεις τις 4k γραμμές κάτω από τις 40k αλλά με κενό τουλάχιστον μιας γραμμής.

Στην 20η στήλη και του μικρού και του μεγάλου πίνακα(ονόμασέ τη ID), συνενώνεις όλες τις τιμές από τα 19 κελιά κάθε γραμμής σε ένα με τη συνάρτηση CONCATENATE. Για παράδειγμα: =CONCATENATE(Α2;Β2;C2;…S2). Έτσι έχεις το «αναγνωριστικό» της κάθε γραμμής.

Στην 21η στήλη του μεγάλου πίνακα (ονόμασέ τη Count), καταμετράς τις εμφανίσεις κάθε τιμής της στήλης ID στην αντίστοιχη στήλη του μικρού πίνακα με τη συνάρτηση COUNTIF. Για παράδειγμα, στο κελί U2 εισάγεις τον τύπο: =COUNTIF($T$40003:$T$44002;T2) και συμπληρώνεις προς τα κάτω.

Εφαρμόζεις αυτόματο φίλτρο στο μεγάλο πίνακα και φιλτράρεις με βάση τη στήλη "Count" κρύβοντας τις γραμμές με count μηδέν. Διαγράφεις όσες γραμμές εμφανίζονται μετά από το φίλτρο. Αφαιρείς το αυτόματο φίλτρο και, αν θέλεις, τις βοηθητικές στήλες και το μικρό πίνακα.

Εννοείται ότι πριν απ’ όλα κρατάς back-up του αρχικού αρχείου.

Υ.Γ.: Στη συνένωση με την CONCATENATE, περιλαμβάνεις όσες στήλες πιστεύεις ότι δημιουργούν ένα επαρκές «αναγνωριστικό». Ίσως να μη χρειάζονται και οι 19.

  • Like 1

Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε

Πρέπει να είστε μέλος για να αφήσετε σχόλιο

Δημιουργία λογαριασμού

Εγγραφείτε με νέο λογαριασμό στην κοινότητα μας. Είναι πανεύκολο!

Δημιουργία νέου λογαριασμού

Σύνδεση

Έχετε ήδη λογαριασμό; Συνδεθείτε εδώ.

Συνδεθείτε τώρα
  • Δημιουργία νέου...