Tag: bioinformatics
Verwenden Sie dieses tag nur für die Programmierung-Verwandte Fragen der Bioinformatik. Die anderen Fragen gehören nicht hierher. Bitte beachten Sie die tag-wiki für mehr Informationen.
4
Antworten
Ich bin ein CS-student mit Interesse in der Bioinformatik Forschung. Ich don ' T haben eine gute Erfahrung mit der Biologie. Was ist die beste Bioinformatik-Buch für Informatiker? InformationsquelleAutor lana | 2010-08-21
3
Antworten
Arbeite ich an einem python-Projekt, wo ich studiere, RNA-Struktur, die die evolution (als Zeichenfolge dargestellt, beispielsweise: "(((...)))" wo die Klammer darstellen Basenpaare). Der springende Punkt dabei ist, dass ich eine ideale Struktur und einer Bevölkerung, die sich
2
Antworten
Habe ich versucht zu installieren gbrowse2 bei ubuntu 15:04. wenn die installation verlief reibungslos, aber wenn ich call-Verbindung eine Fehlermeldung angezeigt, Verboten Sie haben nicht die Berechtigung zum Zugriff auf /cgi-bin/gb2/gbrowse/Hefe auf diese server. Apache/2.4.7 (Ubuntu) Server
3
Antworten
Ich habe keine Ahnung, was das problem sein könnte hier: Ich habe einige Module von Biopython, die ich importieren kann leicht bei Verwendung der interaktiven Eingabeaufforderung oder ausführen von python-Skripts über die Befehlszeile. Das problem ist, wenn
1
Antworten
Ich bin neu in der Programmierung und computer-Welt. Ich versuche zur Untersuchung biomolekularer Simulationen mit MMTK. Ich es in Windows 7 habe ich bereits installiert diese software: python-2.5.4 numpy-1.6.2-win32-Super Pack von Python-GNOME2.5 netCDF4-0.8.2.win32-py2.5 ScientificPython-2.9.0.win32-py2.5 MMTK-2.6.0.win32-py2.5 Wenn ich
3
Antworten
Ich habe mehrere SNP - IDs (D. H., rs16828074, rs17232800, etc...), möchte ich die Koordinaten in einer Hg19 Genom von UCSC-Genom-website. Ich würde lieber mit R um dieses Ziel zu erreichen. Wie macht man das? Können Sie
2
Antworten
Ich habe fast mein needleman-wunsch-Implementierung arbeiten, aber ich bin verwirrt über wie man mit den traceback auf einen bestimmten Fall. Die Idee ist, dass, um zu re konstruieren die Folge (längster Pfad), die wir neu zu berechnen,
14
Antworten
Was ist die beste Wahl des Betriebssystems für Bioinformatik arbeiten? Sind die meisten tools für 64-bit-Windows, für Linux/Unix im Allgemeinen, oder OS X? vielleicht ist diese Frage zu community-wiki? Nicht angezeigt werden Programmierung verwandt. Sie möchten möglicherweise
1
Antworten
Ich habe einen DataFrame, der stammt aus einem df.groupby().size() Betrieb, und sieht wie folgt aus: Localization RNA level cytoplasm 1 Non-expressed 7 2 Very low 13 3 Low 8 4 Medium 6 5 Moderate 8 6 High
3
Antworten
Ich habe Fehler mit dem normalen t-test: data <- read.table("/Users/vdas/Documents/RNA-Seq_Smaples_Udine_08032013/GBM_29052013/UD_RP_25072013/filteredFPKM_matrix.txt",sep="",header=TRUE,stringsAsFactors=FALSE) PGT <- cbind(data[,2],data[,7],data[,24]) PDGT <- cbind(data[,6],data[,8]) pval2 <- NULL for(i in 1:length(PGT[,1])){ pval2 <- c(pval2,t.test(as.numeric(PDGT[i,]),as.numeric(PGT[i,]))$p.value) print(i) } Fehler: Error in t.test.default(as.numeric(PDGT[i, ]), as.numeric(PGT[i, ])) : not enough
11
Antworten
Ich bin auf der Suche nach der Menge an Speicher in bytes (MB, GB, TB, etc.) benötigt zur Speicherung eines einzelnen menschlichen Genoms. Ich Las ein paar Artikel auf Wikipedia über DNA, Chromosomen, base-Paare, Gene und haben
1
Antworten
Ich bin zeichnen einer heatmap und ich möchte nicht die Zeilen-und Spaltennamen sichtbar auf x-und y-Achsen. So habe ich den folgenden code: heatmap.2(data, xlab="PROTEINS", ylab="DRUGS", labRow=FALSE, labCol = FALSE) Dann gibt es einen großen Raum zwischen heatmap
11
Antworten
Habe ich eine fasta-Datei, wie unten gezeigt. Ich möchte konvertieren, die drei-Buchstaben-codes zu einem Buchstaben-code. Wie kann ich das mit python oder R? >2ppo ARGHISLEULEULYS >3oot METHISARGARGMET gewünschte Ausgabe >2ppo RHLLK >3oot MHRRM Ihre Vorschläge würden geschätzt!!
4
Antworten
(Ich habe versucht, diese Frage auf BioStars, aber für die geringe chance, dass jemand von text mining würde denken, es ist eine bessere Lösung, ich bin auch bei der Umbuchung diese hier) Die Aufgabe, die ich versuche
3
Antworten
Habe ich eine kleine fasta Datei von DNA-Sequenzen, die wie folgt aussieht: >NM_000016 700 200 234 ACATATTGGAGGCCGAAACAATGAGGCGTGATCAACTCAGTATATCAC >NM_000775 700 124 236 CTAACCTCTCCCAGTGTGGAACCTCTATCTCATGAGAAAGCTGGGATGAG >NM_003820 700 111 222 ATTTCCTCCTGCTGCCCGGGAGGTAACACCCTGGACCCCTGGAGTCTGCA Fragen: 1) Wie kann ich Lesen Sie diese fasta-Datei in
1
Antworten
Ich habe einen Daten.Rahmen mit Ensembl-IDs in einer Spalte; ich möchte finden Sie die entsprechenden gen-Symbole für die Werte der Spalte, und fügen Sie eine neue Spalte in meine-Daten-frame. Ich bioMaRt verwendet, aber Es konnte keine von
5
Antworten
Ich versuche mich zu übergeben BioPython-Sequenzen zu Ilja Stepanov Umsetzung von Ukkonen ' s suffix-Baum-Algorithmus in iPython-notebook-Umgebung. Ich bin stolpern auf der argparse-Komponente. Habe ich nie zu tun hatte, die direkt mit argparse vor. Wie kann ich
7
Antworten
Angenommen ich habe eine DNA-Sequenz. Ich möchte das ergänzen. Ich verwendete den folgenden code, aber ich bin nicht immer es. Was mache ich falsch ? s=readline() ATCTCGGCGCGCATCGCGTACGCTACTAGC p=unlist(strsplit(s,"")) h=rep("N",nchar(s)) unlist(lapply(p,function(d){ for b in (1:nchar(s)) { if (p[b]=="A")
3
Antworten
Ich habe ein Fortran-Programm und ausführen wollen, ist es in python für mehrere Dateien. Ich habe 2000 input-Dateien, sondern in meinem Fortran-code, den ich in der Lage bin zu laufen, nur eine Datei zu einem Zeitpunkt. Wie
1
Antworten
Ich bin zeichnen einer heatmap und ich möchte nicht die Zeilen-und Spaltennamen sichtbar auf x-und y-Achsen. So habe ich den folgenden code: heatmap.2(data, xlab="PROTEINS", ylab="DRUGS", labRow=FALSE, labCol = FALSE) Dann gibt es einen großen Raum zwischen heatmap
3
Antworten
Grundsätzlich, wenn ich einen string 'AJ' und anderen Zeichenfolge 'AJYF' ich möchte in der Lage sein, zu schreiben 'AJYF'-'AJ' und bekommen 'YF'. Habe ich versucht, dieses bekam aber einen syntax-Fehler. Nur auf einer Seite beachten Sie den
2
Antworten
Arbeite ich mit unix-shell-Skript, das tut Genom-Konstruktion erstellt dann eine Phylogenie. Je nach Genom assembler verwenden Sie die endgültige Ausgabe (Phylogenie) ändern können. Ich wünschte, zu vergleichen, die Auswirkungen der Verwendung verschiedener genome Assembler. Ich entwickelte einige
3
Antworten
Ich versuche zu extrahieren, die eine DNA-Sequenz, die aus dieser FASTA-Datei auf eine angegebene Länge der Basen pro Zeile, sagen wir 40. > sample dna (This is a typical fasta header.) agatggcggcgctgaggggtcttgggggctctaggccggccacctactgg tttgcagcggagacgacgcatggggcctgcgcaataggagtacgctgcct gggaggcgtgactagaagcggaagtagttgtgggcgcctttgcaaccgcc tgggacgccgccgagtggtctgtgcaggttcgcgggtcgctggcgggggt Mithilfe dieses
4
Antworten
Ich versuche, erstellen Sie eine Funktion in R, die mir erlauben, meine filter-Daten basierend auf, ob eine Zeile enthält eine einzelne Spalte mit einer null in es. Darüber hinaus einige Zeiten, ich will nur entfernen Sie die
4
Antworten
Ich bin kein Programmierer und daher einfache Antworten werden geschätzt. Ich bin eine MD und bin involviert in ein Bioinformatik-Projekt. Sagen wir, ich habe ein Python-script, abc.py und ich habe eine text-Datei commandline.txt mit 113 Befehl Linien,
2
Antworten
Habe ich eine Liste von protein-Namen(P1,P2,...,Pn) und Sie werden kategorisiert to drei unterschiedliche expression Hoch(H), Mittel(M) und Low(L), gemessen in drei experimentellen Bedingungen (BSP1,Bsp2, und Exp3). Möchte ich, um ein Grundstück zu machen, wie gezeigt, im unteren
1
Antworten
Hallo bin über eine matrix die expression der gene, frag zählt zu berechnen differentiell exprimierten Gene. Ich würde gerne wissen, wie man entfernen Sie die Zeilen, die Werte wie 0. Dann meine Daten festgelegt werden kompakter und
5
Antworten
Ich habe eine DNA-Sequenz erhalten und möchte das reverse Komplement der es mit Python. Es ist in einer der Spalten einer CSV-Datei und ich würde gerne schreiben das reverse Komplement zu einer anderen Spalte in der gleichen
2
Antworten
Habe ich eine große Variante Anruf format (VCF) Datei (> 4 GB), die Daten für mehrere Proben. Habe ich durchsucht Google, Stackoverflow, sowie versucht die VariantAnnotation-Paket in R irgendwie extrahieren von Daten nur für eine bestimmte Probe,
6
Antworten
Ich habe zwei Daten.frames mit jeweils drei Spalten: chrom, start & stop, nennen wir Sie rangesA und rangesB. Für jede Zeile der rangesA, ich bin auf der Suche zu finden, die (wenn überhaupt) Zeile in rangesB voll
8
Antworten
Ich versuche, finden Sie die entsprechenden Tasten, die in zwei verschiedene Wörterbücher. Jeder hat über 600k Einträge. Sagen Sie zum Beispiel: myRDP = { 'Actinobacter': 'GATCGA...TCA', 'subtilus sp.': 'ATCGATT...ACT' } myNames = { 'Actinobacter': '8924342' } Will
3
Antworten
Arbeite ich mit der NCBI-Referenz-Sequenz accession-Nummern wie variable a: a <- c("NM_020506.1","NM_020519.1","NM_001030297.2","NM_010281.2","NM_011419.3", "NM_053155.2") Abrufen von Informationen aus der biomart-Paket brauche ich, um die zu entfernen .1.2 etc. nach dem Beitritt zahlen. Ich in der Regel tun dies
7
Antworten
Habe ich einen großen Daten.Rahmen von Zeichendaten, die ich konvertieren möchten, basierend auf dem, was man gemeinhin als ein Wörterbuch in anderen Sprachen. Derzeit bin ich über Sie gehen etwa so: foo <- data.frame(snp1 = c("AA", "AG",
10
Antworten
Ich bin auf der Suche nach Größe des Speichers in bytes (MB, GB, TB, was auch immer) benötigt zur Speicherung eines einzelnen menschlichen DNA. Ich Las ein paar Artikel auf Wikipedia über DNA, Chromosomen, Base-Paare, Gene und
2
Antworten
Frage Zum Beispiel, wenn ich wollte, um die Anzahl der Ns in einer Spalte von strings, wie kann ich dies in Google-Tabellen auf einer pro Zelle-basis (d.h. eine Formel, die Punkte in eine Zelle zu einer Zeit,
6
Antworten
Ich habe eine Frage zum extrahieren einen Teil einer Zeichenkette. Ich habe z.B. einen string wie diesen: a <- "DP=26;AN=2;DB=1;AC=1;MQ=56;MZ=0;ST=5:10,7:2;CQ=SYNONYMOUS_CODING;GN=NOC2L;PA=1^1:0.720&2^1:0" Brauch ich zu extrahieren alles, was zwischen GN= und ;.Also hier wird es NOC2L. Ist das möglich?