Tag: bioinformatics

Verwenden Sie dieses tag nur für die Programmierung-Verwandte Fragen der Bioinformatik. Die anderen Fragen gehören nicht hierher. Bitte beachten Sie die tag-wiki für mehr Informationen.

Was ist die beste Bioinformatik Buch für einen Informatiker?

4 Antworten

Ich bin ein CS-student mit Interesse in der Bioinformatik Forschung. Ich don ' T haben eine gute Erfahrung mit der Biologie. Was ist die beste Bioinformatik-Buch für Informatiker? InformationsquelleAutor lana | 2010-08-21

bioinformatics computer-science

Kann ich mit K-means-Algorithmus auf einem string?

3 Antworten

Arbeite ich an einem python-Projekt, wo ich studiere, RNA-Struktur, die die evolution (als Zeichenfolge dargestellt, beispielsweise: "(((...)))" wo die Klammer darstellen Basenpaare). Der springende Punkt dabei ist, dass ich eine ideale Struktur und einer Bevölkerung, die sich

Wie kann man das "you don' T have permission to access /cgi-bin/gb2/gbrowse/Hefe auf diesem server."

2 Antworten

Habe ich versucht zu installieren gbrowse2 bei ubuntu 15:04. wenn die installation verlief reibungslos, aber wenn ich call-Verbindung eine Fehlermeldung angezeigt, Verboten Sie haben nicht die Berechtigung zum Zugriff auf /cgi-bin/gb2/gbrowse/Hefe auf diese server. Apache/2.4.7 (Ubuntu) Server

apache bioinformatics cgi cgi-bin

Warum nicht auch python finden Sie einige Module, wenn ich laufen CGI-Skripte aus dem web?

3 Antworten

Ich habe keine Ahnung, was das problem sein könnte hier: Ich habe einige Module von Biopython, die ich importieren kann leicht bei Verwendung der interaktiven Eingabeaufforderung oder ausführen von python-Skripts über die Befehlszeile. Das problem ist, wenn

bioinformatics biopython cgi python

Wie man dieses Problem beheben ImportError: No module named win32api? (win32api path-variable)

1 Antworten

Ich bin neu in der Programmierung und computer-Welt. Ich versuche zur Untersuchung biomolekularer Simulationen mit MMTK. Ich es in Windows 7 habe ich bereits installiert diese software: python-2.5.4 numpy-1.6.2-win32-Super Pack von Python-GNOME2.5 netCDF4-0.8.2.win32-py2.5 ScientificPython-2.9.0.win32-py2.5 MMTK-2.6.0.win32-py2.5 Wenn ich

bioinformatics environment-variables path python winapi

Karte SNP-IDs in die Genom-Koordinaten

3 Antworten

Ich habe mehrere SNP - IDs (D. H., rs16828074, rs17232800, etc...), möchte ich die Koordinaten in einer Hg19 Genom von UCSC-Genom-website. Ich würde lieber mit R um dieses Ziel zu erreichen. Wie macht man das? Können Sie

bioconductor bioinformatics genetics genome r

Traceback in der dynamischen Programmierung die Umsetzung des Needleman-Wunsch-Algorithmus

2 Antworten

Ich habe fast mein needleman-wunsch-Implementierung arbeiten, aber ich bin verwirrt über wie man mit den traceback auf einen bestimmten Fall. Die Idee ist, dass, um zu re konstruieren die Folge (längster Pfad), die wir neu zu berechnen,

algorithm bioinformatics dynamic-programming python

Beste OS für Bioinformatik?

14 Antworten

Was ist die beste Wahl des Betriebssystems für Bioinformatik arbeiten? Sind die meisten tools für 64-bit-Windows, für Linux/Unix im Allgemeinen, oder OS X? vielleicht ist diese Frage zu community-wiki? Nicht angezeigt werden Programmierung verwandt. Sie möchten möglicherweise

bioinformatics operating-system

Pandas: .groupby().size() und Prozentsätze

1 Antworten

Ich habe einen DataFrame, der stammt aus einem df.groupby().size() Betrieb, und sieht wie folgt aus: Localization RNA level cytoplasm 1 Non-expressed 7 2 Very low 13 3 Low 8 4 Medium 6 5 Moderate 8 6 High

bioinformatics pandas python

Fehler mit t-test

3 Antworten

Ich habe Fehler mit dem normalen t-test: data <- read.table("/Users/vdas/Documents/RNA-Seq_Smaples_Udine_08032013/GBM_29052013/UD_RP_25072013/filteredFPKM_matrix.txt",sep="",header=TRUE,stringsAsFactors=FALSE) PGT <- cbind(data[,2],data[,7],data[,24]) PDGT <- cbind(data[,6],data[,8]) pval2 <- NULL for(i in 1:length(PGT[,1])){ pval2 <- c(pval2,t.test(as.numeric(PDGT[i,]),as.numeric(PGT[i,]))$p.value) print(i) } Fehler: Error in t.test.default(as.numeric(PDGT[i, ]), as.numeric(PGT[i, ])) : not enough

bioinformatics hypothesis-test r

Wie viel Speicher wäre notwendig, die zum speichern eines menschlichen Genoms?

11 Antworten

Ich bin auf der Suche nach der Menge an Speicher in bytes (MB, GB, TB, etc.) benötigt zur Speicherung eines einzelnen menschlichen Genoms. Ich Las ein paar Artikel auf Wikipedia über DNA, Chromosomen, base-Paare, Gene und haben

bioinformatics dna-sequence genetics storage

Entfernen Sie Zeilen-und Spaltennamen - heatmap.2

1 Antworten

Ich bin zeichnen einer heatmap und ich möchte nicht die Zeilen-und Spaltennamen sichtbar auf x-und y-Achsen. So habe ich den folgenden code: heatmap.2(data, xlab="PROTEINS", ylab="DRUGS", labRow=FALSE, labCol = FALSE) Dann gibt es einen großen Raum zwischen heatmap

bioinformatics heatmap r

Wie konvertiere ich die drei-Buchstaben-Aminosäure-codes zu einem Buchstaben-code mit python-oder R?

11 Antworten

Habe ich eine fasta-Datei, wie unten gezeigt. Ich möchte konvertieren, die drei-Buchstaben-codes zu einem Buchstaben-code. Wie kann ich das mit python oder R? >2ppo ARGHISLEULEULYS >3oot METHISARGARGMET gewünschte Ausgabe >2ppo RHLLK >3oot MHRRM Ihre Vorschläge würden geschätzt!!

bioinformatics biopython python r

Durchführen von grundlegenden Multiple sequenzvergleiche in R?

4 Antworten

(Ich habe versucht, diese Frage auf BioStars, aber für die geringe chance, dass jemand von text mining würde denken, es ist eine bessere Lösung, ich bin auch bei der Umbuchung diese hier) Die Aufgabe, die ich versuche

alignment bioinformatics r sequence text-alignment

Lesen FASTA in einen dataframe und extrahieren von untersequenzen der FASTA-Datei

3 Antworten

Habe ich eine kleine fasta Datei von DNA-Sequenzen, die wie folgt aussieht: >NM_000016 700 200 234 ACATATTGGAGGCCGAAACAATGAGGCGTGATCAACTCAGTATATCAC >NM_000775 700 124 236 CTAACCTCTCCCAGTGTGGAACCTCTATCTCATGAGAAAGCTGGGATGAG >NM_003820 700 111 222 ATTTCCTCCTGCTGCCCGGGAGGTAACACCCTGGACCCCTGGAGTCTGCA Fragen: 1) Wie kann ich Lesen Sie diese fasta-Datei in

bioinformatics fasta r subset

Wie kann ich umwandeln Ensembl-ID gen-symbol in R?

1 Antworten

Ich habe einen Daten.Rahmen mit Ensembl-IDs in einer Spalte; ich möchte finden Sie die entsprechenden gen-Symbole für die Werte der Spalte, und fügen Sie eine neue Spalte in meine-Daten-frame. Ich bioMaRt verwendet, aber Es konnte keine von

bioconductor bioinformatics dataframe r

Wie nennen-Modul geschrieben mit argparse in iPython notebook

5 Antworten

Ich versuche mich zu übergeben BioPython-Sequenzen zu Ilja Stepanov Umsetzung von Ukkonen ' s suffix-Baum-Algorithmus in iPython-notebook-Umgebung. Ich bin stolpern auf der argparse-Komponente. Habe ich nie zu tun hatte, die direkt mit argparse vor. Wie kann ich

bioinformatics biopython ipython python suffix-tree

Komplement einer DNA-Sequenz

7 Antworten

Angenommen ich habe eine DNA-Sequenz. Ich möchte das ergänzen. Ich verwendete den folgenden code, aber ich bin nicht immer es. Was mache ich falsch ? s=readline() ATCTCGGCGCGCATCGCGTACGCTACTAGC p=unlist(strsplit(s,"")) h=rep("N",nchar(s)) unlist(lapply(p,function(d){ for b in (1:nchar(s)) { if (p[b]=="A")

bioinformatics complement genetics r replace

WinError 2, Das system kann nicht die angegebene Datei gefunden (Python)

3 Antworten

Ich habe ein Fortran-Programm und ausführen wollen, ist es in python für mehrere Dateien. Ich habe 2000 input-Dateien, sondern in meinem Fortran-code, den ich in der Lage bin zu laufen, nur eine Datei zu einem Zeitpunkt. Wie

bioinformatics f2py python python-2.7 python-3.x

Entfernen Sie Zeilen-und Spaltennamen - heatmap.2

1 Antworten

Ich bin zeichnen einer heatmap und ich möchte nicht die Zeilen-und Spaltennamen sichtbar auf x-und y-Achsen. So habe ich den folgenden code: heatmap.2(data, xlab="PROTEINS", ylab="DRUGS", labRow=FALSE, labCol = FALSE) Dann gibt es einen großen Raum zwischen heatmap

bioinformatics heatmap r

Wie zu subtrahieren strings in python

3 Antworten

Grundsätzlich, wenn ich einen string 'AJ' und anderen Zeichenfolge 'AJYF' ich möchte in der Lage sein, zu schreiben 'AJYF'-'AJ' und bekommen 'YF'. Habe ich versucht, dieses bekam aber einen syntax-Fehler. Nur auf einer Seite beachten Sie den

bioinformatics python python-2.7 string

Die Organisation der Ausgabe von mein shell-script in Tabellen in text-Datei

2 Antworten

Arbeite ich mit unix-shell-Skript, das tut Genom-Konstruktion erstellt dann eine Phylogenie. Je nach Genom assembler verwenden Sie die endgültige Ausgabe (Phylogenie) ändern können. Ich wünschte, zu vergleichen, die Auswirkungen der Verwendung verschiedener genome Assembler. Ich entwickelte einige

bioinformatics genome shell text-files unix

Undefined Subroutinen &main Fehler in Perl

3 Antworten

Ich versuche zu extrahieren, die eine DNA-Sequenz, die aus dieser FASTA-Datei auf eine angegebene Länge der Basen pro Zeile, sagen wir 40. > sample dna (This is a typical fasta header.) agatggcggcgctgaggggtcttgggggctctaggccggccacctactgg tttgcagcggagacgacgcatggggcctgcgcaataggagtacgctgcct gggaggcgtgactagaagcggaagtagttgtgggcgcctttgcaaccgcc tgggacgccgccgagtggtctgtgcaggttcgcgggtcgctggcgggggt Mithilfe dieses

bioinformatics fasta perl subroutine

Entfernen von Zeilen aus dataframe enthält nur 0 oder einfach nur eine 0

4 Antworten

Ich versuche, erstellen Sie eine Funktion in R, die mir erlauben, meine filter-Daten basierend auf, ob eine Zeile enthält eine einzelne Spalte mit einer null in es. Darüber hinaus einige Zeiten, ich will nur entfernen Sie die

bioinformatics data-processing filtering r

Parallele Ausführung von mehreren Aufträgen in einem python-Skript

4 Antworten

Ich bin kein Programmierer und daher einfache Antworten werden geschätzt. Ich bin eine MD und bin involviert in ein Bioinformatik-Projekt. Sagen wir, ich habe ein Python-script, abc.py und ich habe eine text-Datei commandline.txt mit 113 Befehl Linien,

bioinformatics parallel-processing python

Grundstück von kategorischen Daten mit R

2 Antworten

Habe ich eine Liste von protein-Namen(P1,P2,...,Pn) und Sie werden kategorisiert to drei unterschiedliche expression Hoch(H), Mittel(M) und Low(L), gemessen in drei experimentellen Bedingungen (BSP1,Bsp2, und Exp3). Möchte ich, um ein Grundstück zu machen, wie gezeigt, im unteren

bioinformatics ggplot2 plot r

So entfernen Sie Zeilen mit 0-Werten mit R

1 Antworten

Hallo bin über eine matrix die expression der gene, frag zählt zu berechnen differentiell exprimierten Gene. Ich würde gerne wissen, wie man entfernen Sie die Zeilen, die Werte wie 0. Dann meine Daten festgelegt werden kompakter und

bioinformatics r

Reverse Komplement der DNA-Strang mit Python

5 Antworten

Ich habe eine DNA-Sequenz erhalten und möchte das reverse Komplement der es mit Python. Es ist in einer der Spalten einer CSV-Datei und ich würde gerne schreiben das reverse Komplement zu einer anderen Spalte in der gleichen

bioinformatics biopython dna-sequence list python

Auszug sample-Daten von VCF-Dateien

2 Antworten

Habe ich eine große Variante Anruf format (VCF) Datei (> 4 GB), die Daten für mehrere Proben. Habe ich durchsucht Google, Stackoverflow, sowie versucht die VariantAnnotation-Paket in R irgendwie extrahieren von Daten nur für eine bestimmte Probe,

bioinformatics r

Finden überlappung in Bereiche mit R

6 Antworten

Ich habe zwei Daten.frames mit jeweils drei Spalten: chrom, start & stop, nennen wir Sie rangesA und rangesB. Für jede Zeile der rangesA, ich bin auf der Suche zu finden, die (wenn überhaupt) Zeile in rangesB voll

bioinformatics r

Suche nach passenden Schlüssel in den beiden großen Wörterbüchern und tun es schnell

8 Antworten

Ich versuche, finden Sie die entsprechenden Tasten, die in zwei verschiedene Wörterbücher. Jeder hat über 600k Einträge. Sagen Sie zum Beispiel: myRDP = { 'Actinobacter': 'GATCGA...TCA', 'subtilus sp.': 'ATCGATT...ACT' } myNames = { 'Actinobacter': '8924342' } Will

bioinformatics python

Entfernen Sie einen Teil der Zeichenfolge nach "."

3 Antworten

Arbeite ich mit der NCBI-Referenz-Sequenz accession-Nummern wie variable a: a <- c("NM_020506.1","NM_020519.1","NM_001030297.2","NM_010281.2","NM_011419.3", "NM_053155.2") Abrufen von Informationen aus der biomart-Paket brauche ich, um die zu entfernen .1.2 etc. nach dem Beitritt zahlen. Ich in der Regel tun dies

bioinformatics biomart r regex string

Wörterbuchstil ersetzt mehrere Elemente

7 Antworten

Habe ich einen großen Daten.Rahmen von Zeichendaten, die ich konvertieren möchten, basierend auf dem, was man gemeinhin als ein Wörterbuch in anderen Sprachen. Derzeit bin ich über Sie gehen etwa so: foo <- data.frame(snp1 = c("AA", "AG",

bioinformatics dataframe r

Wie viel Speicher wäre erforderlich, um menschliche DNA zu speichern?

10 Antworten

Ich bin auf der Suche nach Größe des Speichers in bytes (MB, GB, TB, was auch immer) benötigt zur Speicherung eines einzelnen menschlichen DNA. Ich Las ein paar Artikel auf Wikipedia über DNA, Chromosomen, Base-Paare, Gene und

bioinformatics

Zählen Sie das Auftreten bestimmter Zeichen pro Zelle

2 Antworten

Frage Zum Beispiel, wenn ich wollte, um die Anzahl der Ns in einer Spalte von strings, wie kann ich dies in Google-Tabellen auf einer pro Zelle-basis (d.h. eine Formel, die Punkte in eine Zelle zu einer Zeit,

bioinformatics character count google-spreadsheet

R Teil der Zeichenfolge extrahieren

6 Antworten

Ich habe eine Frage zum extrahieren einen Teil einer Zeichenkette. Ich habe z.B. einen string wie diesen: a <- "DP=26;AN=2;DB=1;AC=1;MQ=56;MZ=0;ST=5:10,7:2;CQ=SYNONYMOUS_CODING;GN=NOC2L;PA=1^1:0.720&2^1:0" Brauch ich zu extrahieren alles, was zwischen GN= und ;.Also hier wird es NOC2L. Ist das möglich?

bioinformatics extract r regex string