Προς το περιεχόμενο

Πως σβήνω 1,000,000 txt αρχεία?


polaki

Προτεινόμενες αναρτήσεις

  • Απαντ. 50
  • Δημ.
  • Τελ. απάντηση
Δημοσ.
και δε μου λες, πως δημιουργηθηκαν ολα αυτα τα αρχεια;

 

Ε ναι παιδια εχουμε 2 σελίδες thread... :D

 

Λοιπον κοιτάξτε ένα screenshot να δείτε!

 

singpro0ud.jpg

Δημοσ.

Το αστείο ξέρεις ποιο είναι; Πώς μπορεί το size on disk να είναι 7,14gb, αλλά το actual size θα είναι τουλάχιστον το 1/10 (πχ. αν το zip-άρεις).

Εντελώς κουλό αλλά έχει να κάνει με τον τρόπο που διαχειρίζεται τον τρόπο αποθήκευσης των αρχείων το File System.

 

1 αρχείο-many clusters, αλλά 1 cluster-1 αρχείο, οπότε ένα αρχείο που πιάνει ούτε καν 1kb, αφήνει αρκετό αχρησιμοποίητο χώρο που θεωρείται όμως δεσμευμένος...

Δημοσ.

Έχω δει πολλές μ@λακίες σε software, το συγκεκριμένο όμως σπάει όλα τα ρεκόρ... Χάθηκε να το βάλουν να γράφει σε μια βάση; Ποιός μαλάκας ενέκρινε αυτό το τερατούργημα;

 

Μάλλον αυτός που τα τσέπωσε θα μου πείτε...

Δημοσ.
Έχω δει πολλές μ@λακίες σε software' date=' το συγκεκριμένο όμως σπάει όλα τα ρεκόρ... Χάθηκε να το βάλουν να γράφει σε μια βάση; Ποιός μαλάκας ενέκρινε αυτό το τερατούργημα;

 

Μάλλον αυτός που τα τσέπωσε θα μου πείτε...[/quote']

 

Μπα, επειδή δουλεύω στην εταιρία, δεν τα τσέπωσε κανένας, και ακριβώς γι'αυτόν τον λόγο τουλάχιστον έχουμε αυτό το αρπακόλα backup σε κεντρικό pc ώστε να μην χτυπιώμαστε μετά αν πχ. καεί κανένας δίσκος σε κατάστημα...

 

Ότι και να λες εσύ, αν το αφεντικό δεν σου εγκρίνει το κόστος για backup σε βάση ή όπου να'ναι, τα χέρια σου είναι δεμένα! :)

Δημοσ.
size = 1.53gb

 

ειδικα σε zip βγαινει λιγο λιγοτερο

Επειδή είναι text αρχεία θα έπρεπε όταν τα συμπιέζεις να πιάνουν *πολύ* λιγότερο χώρο και όχι λίγο όπως λες. Εύκολα δηλαδή το 1.53GB να πέφτει κάτω από GB, για να μη πω κάτω από μισό GB..

 

..εκτός αν με το "λίγο λιγότερο" ειρωνεύεσαι την κατάσταση και όντως εννοείς ότι εξοικονομείται πολύς χώρος.

 

EDIT:

Άκυρο, προφανώς επειδή το μέγεθος του κάθε αρχείου είναι μικρό, το overhead της συμπίεσης γίνεται σημαντικό, και το αποτέλεσμα είναι αρχείο με μικρό ratio συμπίεσης. Σωστά λοιπόν δεν θα είναι μεγάλο το κέρδος.

Δημοσ.

Δουλεύεις στην εταιρία που φτιάχνει το συγκεκριμένο software? Φυσικά το χρησιμοποιούμε και μείς (δεν υπάρχει εναλλακτική λύση) και έχουμε τραβήξει τα μαλλιά μας ουκ ολίγες φορές.

Δημοσ.

το συγκεκριμενο software το εχει φτιαξει η Effective. ειναι για πολλα κλαμματα, εχει απιστευτα bugs τρωει μνημη λες και ειναι κανενα Pinnacle Studio και γενικα δεν δουλευει με HP Laser Printer εκτος εαν κανεις "πο**ια" με αναδρομολογηση.

 

οταν εβγαλαν τον νομο για του ΦΗΜ καποιος τα τσεπωσε πολυ χοντρα!

Δημοσ.

Αυτους που εχουμε εμεις παντως τους λένε Casio, δεν ηξερα καν οτι υπάρχουν κ αλλοι..

Δεν δουλεύω στην εταιρία του software, σε μια εμπορικη εταιρία δουλεύω και "ευτυχως" απτα 100 μαγαζιά τα 55-60 ειναι δικά "μας", τα αλλα ειναι franchise γιατί αλλιώς ακόμα θα έσβηνε! :D :D :D

 

Εpa το μεγεθος που λεει 1.5gb είναι με δεδομένο οτι τα txt αρχεια ειναι περίπου 1kb το καθένα, οπότε δυσκολα συμπιέζονται περισσότερο. Ουσιαστικά ο μόνος λόγος που τα συμπιέζω είναι για να θεωρείται ως ΕΝΑ αρχείο και να μπορεί να γραφτεί σε DVD.. Γιατι κοντα 2,000,000 αρχεία δεν μπορεί το Νero να γράψει, μου έχει κάψει γυρω στα 3-4 DVD απο δοκιμές.....(όοοοοοοοοοοταν με τα πολλά έγιναν add τα αρχεία και άρχισε το "κάψιμο")

Δημοσ.

Το μοντέλο είναι το FP-500 και επειδή έχω δουλέψει με αρκετά μοντέλα (κι από άλλους προμηθευτές/κατασκευαστές), ξαναλέω πως λειτουργούν καλύτερα από ΟΛΟΥΣ! Είχα φτάσει στο σημείο να βγάζω τους άλλους μηχανισμούς και να βάζω αυτούς.

Δημοσ.

παιδιά το winrar θα τα ξεσκισει στο πατίκωμα αυτα τα αρχεία.

τυπικη συμπίεση για ascii ειναι 90%, δηλ, το 1 γιγα, το κάνει 100-150 mb.

 

1. επιλέγεις Solid compression.

Tι σημαινει solid, με απλα λογια (οι αλγοριθμοι συμπιεσης ειναι πολυ πιο πολυπλοκοι, αλλα να το πουμε απλά): εστω οτι εχεις 100 αρχεια, και το καθένα έχει τον χαρακτήρα "Α", 50 φορές μέσα. συνολο 5000 bytes.

a) με απλή συμπίεση, το winrar (ή όποιο αλλο εχει επιλογή solid),

πιάνει το 1ο, βρισκει 50 "Α", και φτιαχνει ενα συμπιεσμένο, στο Temp, που περιεχει "50xΑ".

δηλ, αντι να αποθηκέυσει 50 bytes, αποθηκεύει 4. ετσι προκυπτει η συμπίεση.

μετα πιάνει το 2ο αρχείο, κάνει το ίδιο, το κολάει στο τέλος του 1ου temp, κ.ο.κ

οταν τελειώσει με όλα, σωνει το temp, στο φακελο σου με καταληξη rar.

με αυτο το ιδανικό και απλοϊκό σενάριο, θα εχει αποθηκευσει ενα αρχειο που περιεχει:

"50xΑ50xΑ50xΑ50xΑ50xΑ50xΑ50xΑ..." δηλ. 4x100=400 bytes (συν κατι ψιλά για να ξεχωρίζει τα αρχεια και να μπορέσει να κανει αποσυμπίεση, ας τα πούμε control και header bytes)

 

B) με solid compression,

πρώτα διαβάζει ΟΛΑ τα αρχεία, τα ενωνει σε ενα temp, και ψαχνει τις επαναλήψεις χαρακτήρων. Θα βρει 100χ10 "A"

αποθηκέυει 1000χΑ. σύνολο 6 bytes + τα controls !!!!

 

Οπως καταλαβαίνετε, η επιλογή Solid δεν εχει καμια αξία αν επιλέγεις 1 μονο αρχείο προς συμπίεση.

 

2. ποιο ειναι το μειονέκτημα? οτι αν γινει corrupt το solid, τα χάνεις όλα . Αυτό συβαίνει ακόμα κι αν επιλέξεις split to volumes ( .part01.rar κλπ ). Δεν ειναι αυτόνομα αρχεία. αν χαλάσει ενα, και τα άλλα δεν αποσυμπιέζονται.

 

ενω το απλό, υπάρχει περίπτωση να σώσεις κάποια απο την αρχή, μέση ή τέλος, ανάλογα που θα γίνει το corruption.

 

Φυσικά υπάρχει πάντα η επιλογή "put recovery record". αλλα για πολλα αρχεία, θα αυξησει σημαντικά το μέγεθος του rar, οποτε τα υπερ και τα κατά ειναι θεμα δοκιμών.

 

 

Στη συγκεκριμένη περίπτωση, με τα φορολογικά, επειδη και 1 να χάσεις θα πάθεις ζημιά... θεωρώ οτι, οτι συμπίεση και να επιλέξεις, δεν μπορεις να βασιζεσαι στο filesystem ΕΝΟΣ σκληρού, για την ασφάλεια σου.

ετσι κι αλλιως, εγω θα ειχα το μπακαπ σε 2 σκληρούς, και 4-5 cd. αρα θεμα corruption δεν υπάρχει, καλυτερα να μου πιάνει το rar σε αυτα τα μέσα.. 50 mb, παρά 200 mb.

Τωρα, για οικιακή χρήση, που δεν θα κάνω μπακαπ σε 5 cd, σαφώς για 1 μονο rar, θα προτιμήσω την απλή συμπίεση, ή την solid, αλλα οχι όλα σε 1 rar, αλλα σε πολλά αυτόνομα.

 

3. μπορεις να επιλέξεις και "delete files after archiving" για το σβησιμο.

το αν θα παίξει, εξαρτάται απο τη μνημη σου, και ποσο χώρο εχεις στο δισκο που φιλοξενει το temp folder.

Με 1 εκατομ. αρχεία, πολλά pc, θα τα φτύσουν πριν τελειώσει το compress. ο ιδιος λογος που δεν στα γράφει το Nero.

 

 

εγω θα εφτιαχνα ενα απλο προγραμματακι σε vb, vbscript, autoit, κλπ, να πάρει τα αρχεια σε ισομερή περιπου πακέτα και να τα στέλνει σε command line συμπιεστικό.

πχ μια λούπα που να πιάνει ευρος ονομάτων ή ημερομηνιών και μόλις πιάσει ενα όριο πχ 1.000 ή 50.000 , να σταματάει, συμπιέζει, και μετά πιάνει τα επόμενα.

Δημοσ.
Σε πληροφορώ όμως ότι οι συγκεκριμένοι φορολογικοί μηχανισμοί δουλεύουν καλύτερα από πολλούς άλλους!

 

συμφωνω απολυτα μαζι σου, σαν μηχανισμοι ειναι πολυ καλοι, το λογισμικο ομως που "ελεγχει" τους μηχανισμους ειναι για κλαμματα κυριολεκτικα ( εχω μεινει στην εκδοση 1.1.97 ) δεν ξερω εαν βγηκε νεοτερη ( αλλαξα δουλεια και δεν ασχολουμαι πλεον με τετοια )

Δημοσ.
Το μοντέλο είναι το FP-500 και επειδή έχω δουλέψει με αρκετά μοντέλα (κι από άλλους προμηθευτές/κατασκευαστές), ξαναλέω πως λειτουργούν καλύτερα από ΟΛΟΥΣ! Είχα φτάσει στο σημείο να βγάζω τους άλλους μηχανισμούς και να βάζω αυτούς.

 

και εσυ παθων του proline ε? χιλιες φορες ο Casio

Αρχειοθετημένο

Αυτό το θέμα έχει αρχειοθετηθεί και είναι κλειστό για περαιτέρω απαντήσεις.

  • Δημιουργία νέου...