Tag: fasta

FASTA ist ein software-Paket für das Sequenz-alignment von Proteinen und Nukleinsäuren. FASTA ist auch der name der Datei-format verwendet, die von diesen Programmen zum darstellen von Sequenzen von Peptiden oder nukleotiden. Das format ist ein de-facto-standard in der Bioinformatik.

Mit Biopython (Python) zu extrahieren Sequenz aus der FASTA-Datei

Anzahl der Antworten 2 Antworten
Ok, also muss ich extrahieren, die Teil einer Sequenz aus einer FASTA-Datei mit python (biopython, http://biopython.org/DIST/docs/tutorial/Tutorial.html) Ich brauche, um die ersten 10 Basen von jeder Sequenz und setzen Sie Sie in einer Datei, die Erhaltung der Reihenfolge-info

Verkettung Mehrerer .fasta-Dateien

Anzahl der Antworten 5 Antworten
Ich versuche zu verketten Hunderte von .fasta-Dateien in eine einzige, große fasta Datei mit allen Sequenzen. Ich habe nicht gefunden, die eine bestimmte Methode, dies zu erreichen in den Foren. Ich habe in diesem code aus http://zientzilaria.heroku.com/blog/2007/10/29/merging-single-or-multiple-sequence-fasta-files,

Sequenz Länge der FASTA-Datei

Anzahl der Antworten 3 Antworten
Habe ich Folgendes FASTA-Datei: >header1 CGCTCTCTCCATCTCTCTACCCTCTCCCTCTCTCTCGGATAGCTAGCTCTTCTTCCTCCT TCCTCCGTTTGGATCAGACGAGAGGGTATGTAGTGGTGCACCACGAGTTGGTGAAGC >header2 GGT >header3 TTATGAT Meine gewünschte Ausgabe: >header1 117 >header2 3 >header3 7 # 3 sequences, total length 127. Dies ist mein code: awk '/^>/{print; next; } { seqlen =

Lesen FASTA in einen dataframe und extrahieren von untersequenzen der FASTA-Datei

Anzahl der Antworten 3 Antworten
Habe ich eine kleine fasta Datei von DNA-Sequenzen, die wie folgt aussieht: >NM_000016 700 200 234 ACATATTGGAGGCCGAAACAATGAGGCGTGATCAACTCAGTATATCAC >NM_000775 700 124 236 CTAACCTCTCCCAGTGTGGAACCTCTATCTCATGAGAAAGCTGGGATGAG >NM_003820 700 111 222 ATTTCCTCCTGCTGCCCGGGAGGTAACACCCTGGACCCCTGGAGTCTGCA Fragen: 1) Wie kann ich Lesen Sie diese fasta-Datei in

analysieren einer fasta-Datei mit einem generator ( python )

Anzahl der Antworten 4 Antworten
Ich versuche zu analysieren, eine große fasta-Datei und ich bin der Begegnung mit out of memory-Fehler. Einige Vorschläge zur Verbesserung der Daten-handling würde geschätzt werden. Derzeit ist das Programm korrekt druckt den Namen, die jedoch teilweise durch

Undefined Subroutinen &main Fehler in Perl

Anzahl der Antworten 3 Antworten
Ich versuche zu extrahieren, die eine DNA-Sequenz, die aus dieser FASTA-Datei auf eine angegebene Länge der Basen pro Zeile, sagen wir 40. > sample dna (This is a typical fasta header.) agatggcggcgctgaggggtcttgggggctctaggccggccacctactgg tttgcagcggagacgacgcatggggcctgcgcaataggagtacgctgcct gggaggcgtgactagaagcggaagtagttgtgggcgcctttgcaaccgcc tgggacgccgccgagtggtctgtgcaggttcgcgggtcgctggcgggggt Mithilfe dieses

so Lesen Sie eine fasta-Datei in python?

Anzahl der Antworten 3 Antworten
Ich versuche zu Lesen, eine FASTA-Datei, und dann finden Sie bestimmte Motiv(string) und drucken Sie sich die Reihenfolge und die Anzahl der Zeiten, die Sie Auftritt. Ein FASTA-Datei ist nur die Serie von Sequenzen(strings), beginnt mit einer

Entfernen Zeilenumbrüche in einer FASTA-Datei

Anzahl der Antworten 6 Antworten
Habe ich eine fasta-Datei, wo die Sequenzen aufgebrochen werden mit newlines. Ich möchte zum entfernen der Zeilenumbrüche. Hier ist ein Beispiel meiner Datei: >accession1 ATGGCCCATG GGATCCTAGC >accession2 GATATCCATG AAACGGCTTA Möchte ich es konvertieren in: >accession1 ATGGCCCATGGGATCCTAGC >accession2

wie zu Lesen FASTA in dataframe und extrahieren von untersequenzen der FASTA-Datei in R

Anzahl der Antworten 3 Antworten
Habe ich eine kleine fasta-Datei von DNA-Sequenzen, die wie folgt aussieht: >NM_000016 700 200 234 ACATATTGGAGGCCGAAACAATGAGGCGTGATCAACTCAGTATATCAC >NM_000775 700 124 236 CTAACCTCTCCCAGTGTGGAACCTCTATCTCATGAGAAAGCTGGGATGAG >NM_003820 700 111 222 ATTTCCTCCTGCTGCCCGGGAGGTAACACCCTGGACCCCTGGAGTCTGCA Fragen: 1) Wie kann ich Lesen Sie diese fasta-Datei in das