Linien drucken in eine Datei übereinstimmende Muster in einer anderen Datei

Habe ich eine Datei mit mehr als 40.000 Zeilen (Datei1) und ich möchte, um die Zeilen zu extrahieren passenden Muster in Datei2 (über 6000 Zeilen). Ich benutze grep, wie diese, aber es ist sehr langsam:
grep -f file2 file1 > out

Gibt es einen schnelleren Weg, dies zu tun mit awk oder sed?

Hier einige Auszüge aus meinen Dateien:

File1:
scitn003869.2| scign003869 CGCATGTGTGCATGTATTATCGTATCCCTTG
scitn007747.1| scign007747  CACGCAGACGCAGTGGAGCATTCCAGGTCACAA
scitn003155.1| scign003155  TAAAAATCGTTAGCACTCGCTTGGTACACTAAC
scitn018252.1| scign018252  CGTGTGTGTGCATATGTGTGCATGCGTG
scitn004671.2| scign004671  TCCTCAGGTTTTGAAAGGCAGGGTAAGTGCT

File2:
scign000003
scign000004
scign000005
scign004671
scign000013

`

InformationsquelleAutor Jon | 2014-01-27
Schreibe einen Kommentar