Tag: fastq

FASTQ-format speichert Sequenzen und Phred Qualitäten in einer einzigen Datei. Es ist kurz und kompakt. -> http://maq.sourceforge.net/fastq.shtml

Wie verwende ich die parallele Programmierung/Multithreading in meinem bash-Skript?

Anzahl der Antworten 2 Antworten
Dies ist mein Skript: #!/bin/bash #script to loop through directories to merge fastq files sourcedir=/path/to/source destdir=/path/to/dest for f in $sourcedir/* do fbase=$(basename "$f") echo "Inside $fbase" zcat $f/*R1*.fastq.gz | gzip > $destdir/"$fbase"_R1.fastq.gz zcat $f/*R2*.fastq.gz | gzip >

Lesen Sie die Liste der Dateien, die auf unix-und Befehl ausführen

Anzahl der Antworten 3 Antworten
Ich bin ziemlich neu in shell-scripting und ich habe zu kämpfen den ganzen Tag, um herauszufinden, wie können Sie eine "for" - Befehl. Im Grunde, was ich versuche zu tun, ist das folgende: Habe ich eine list.txt

bash: /bin/ls: Argument list too long

Anzahl der Antworten 3 Antworten
Ich brauche, um eine Liste mit einer großen Anzahl von Dateien (rund 40.000 Dateien) wie unten: ERR001268_1_100.fastq ERR001268_2_156.fastq ERR001753_2_78.fastq ERR001268_1_101.fastq ERR001268_2_157.fastq ERR001753_2_79.fastq ERR001268_1_102.fastq ERR001268_2_158.fastq ERR001753_2_7.fastq ERR001268_1_103.fastq ERR001268_2_159.fastq ERR001753_2_80.fastq mein Befehl ist: ls ERR*_1_*.fastq |sed 's/\.fastq//g'|sort -n >

Konvertieren von FASTQ zu FASTA mit SED/AWK

Anzahl der Antworten 12 Antworten
Ich habe eine Daten in das kommt immer in block vier im folgenden format (genannt FASTQ): @SRR018006.2016 GA2:6:1:20:650 length=36 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGN +SRR018006.2016 GA2:6:1:20:650 length=36 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!+! @SRR018006.19405469 GA2:6:100:1793:611 length=36 ACCCGCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCC +SRR018006.19405469 GA2:6:100:1793:611 length=36 7);;).;);;/;*.2>/@@7;@77<..;)58)5/>/ Gibt es eine einfache sed/awk/bash

schnellerer Mitgliedschaftstest in Python als set ()

Anzahl der Antworten 4 Antworten
Habe ich zu überprüfen, die Anwesenheit von Millionen von Elementen (20-30 Buchstaben "str") in der Liste mit 10-100k an diese Elemente. Ist es schneller Weg, es zu tun in python als set() ? import sys #load ids