kombinieren Sie mehrere text-Dateien und entfernen Sie Duplikate

Habe ich rund 350 text-Dateien (jede Datei ist rund 75 MB). Ich versuche zu kombinieren, Sie alle Dateien und entfernen Sie doppelte Einträge. Die Datei wird im folgenden format ein:

ip1,dns1
ip2,dns2
...

Schrieb ich ein kleines shell-Skript dazu

#!/bin/bash
for file in data/*
do
    cat "$file" >> dnsFull
done
sort dnsFull > dnsSorted
uniq dnsSorted dnsOut
rm dnsFull dnsSorted

Ich mache diese Verarbeitung oft und Frage mich, ob es irgendetwas gibt, das ich tun könnte, um zu verbessern, die Verarbeitung das nächste mal, wenn ich ihn laufen. Ich bin offen für jede Programmiersprache und Anregungen. Danke!

Sie könnten auch geben Art -m a versuchen --> es wird die Sortierung der einzelnen Dateien, und führen Sie Sie entsprechend daher sollte sparen einiges an Zeit .... der -m-option verfügbar war, VK für Szenario wie dieses ... ie Art -m-Datei* | uniq -u

InformationsquelleAutor drk | 2013-06-01

Schreibe einen Kommentar