Tag: fastq
FASTQ-format speichert Sequenzen und Phred Qualitäten in einer einzigen Datei. Es ist kurz und kompakt. -> http://maq.sourceforge.net/fastq.shtml
2
Antworten
Dies ist mein Skript: #!/bin/bash #script to loop through directories to merge fastq files sourcedir=/path/to/source destdir=/path/to/dest for f in $sourcedir/* do fbase=$(basename "$f") echo "Inside $fbase" zcat $f/*R1*.fastq.gz | gzip > $destdir/"$fbase"_R1.fastq.gz zcat $f/*R2*.fastq.gz | gzip >
3
Antworten
Ich bin ziemlich neu in shell-scripting und ich habe zu kämpfen den ganzen Tag, um herauszufinden, wie können Sie eine "for" - Befehl. Im Grunde, was ich versuche zu tun, ist das folgende: Habe ich eine list.txt
3
Antworten
Ich brauche, um eine Liste mit einer großen Anzahl von Dateien (rund 40.000 Dateien) wie unten: ERR001268_1_100.fastq ERR001268_2_156.fastq ERR001753_2_78.fastq ERR001268_1_101.fastq ERR001268_2_157.fastq ERR001753_2_79.fastq ERR001268_1_102.fastq ERR001268_2_158.fastq ERR001753_2_7.fastq ERR001268_1_103.fastq ERR001268_2_159.fastq ERR001753_2_80.fastq mein Befehl ist: ls ERR*_1_*.fastq |sed 's/\.fastq//g'|sort -n >
12
Antworten
Ich habe eine Daten in das kommt immer in block vier im folgenden format (genannt FASTQ): @SRR018006.2016 GA2:6:1:20:650 length=36 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGN +SRR018006.2016 GA2:6:1:20:650 length=36 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!+! @SRR018006.19405469 GA2:6:100:1793:611 length=36 ACCCGCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCC +SRR018006.19405469 GA2:6:100:1793:611 length=36 7);;).;);;/;*.2>/@@7;@77<..;)58)5/>/ Gibt es eine einfache sed/awk/bash
4
Antworten
Habe ich zu überprüfen, die Anwesenheit von Millionen von Elementen (20-30 Buchstaben "str") in der Liste mit 10-100k an diese Elemente. Ist es schneller Weg, es zu tun in python als set() ? import sys #load ids