So berechnen Sie mehrere Sequenzausrichtung für Textzeichenfolgen

Ich Schreibe ein Programm, das zur Berechnung einer multiple sequence alignment der einen Satz von Zeichenketten. Ich dachte, dies zu tun, in Python, aber ich könnte eine externe software oder eine andere Sprache, wenn das praktischer. Die Daten werden nicht besonders groß, ich haben keine starken Anforderungen an die Systemleistung und ich kann tolerieren Annäherungen (ie. Ich muss nur eine ausreichend gute Ausrichtung). Das problem ist nur, dass die strings sind regelmäßige Zeichenfolgen (dh. UTF-8-Zeichenfolgen möglicherweise mit Zeilenumbrüchen, die behandelt werden sollte als reguläres Zeichen); Sie sind nicht DNA-Sequenzen oder Proteinsequenzen.

Kann ich feststellen, Tonnen von Werkzeugen und Informationen, die für die üblichen Fälle in der Bioinformatik mit bestimmten komplizierten Datei-Formate und eine Vielzahl von Funktionen, die ich nicht brauchen, aber es ist unexpectly schwer zu finden, software, Bibliotheken oder Beispiel-code für den einfachen Fall von strings. Ich könnte wahrscheinlich implementieren Sie eine der vielen algorithmen für dieses problem, oder codieren meine string-DNA, aber es muss einen besseren Weg geben. Kennt Ihr irgendwelche Lösungen?

Dank!

InformationsquelleAutor der Frage a3nm | 2011-04-28

Schreibe einen Kommentar