Tag: r-faq
Die r-faq-tag wird erstellt, um die Gruppe eine begrenzte Anzahl von Fragen, Probleme diskutieren, die kommen regelmäßig auf die R tag. Es ist nicht die offizielle FAQ auf R SO, aber sollte sich als eine interessante Quelle für Informationen über häufige Probleme.
3
Antworten
Ein Kunde schickte mir eine Excel-Datei mit den Daten formatiert.e.g 3/15/2012 für März 15. Ich speicherte diese als .csv-Datei und dann camm$Date <- as.Date(camm$Date, "%m/%d/%y") aber dies gab mir die Werte ab dem Jahr 2020! Habe ich
4
Antworten
Ich haben Liste, wo die elementnames sind ID-tags und enthält ein Vektor mit numerischen Werten. Diese sind von ungleichen(!) Länge. Möchte ich, um es zu transformieren, um einen Daten-frame, wo ich die ID in einer Spalte und
3
Antworten
Ich habe einen dataframe mit numerischen Einträgen wie diesem test <- data.frame(x = c(26, 21, 20), y = c(34, 29, 28)) Wie bekomme ich den folgenden Vektor? > 26, 34, 21, 29, 20, 28 Ich war in
14
Antworten
Nehme ich gerne die Daten des Formulars before = data.frame(attr = c(1,30,4,6), type=c('foo_and_bar','foo_and_bar_2')) attr type 1 1 foo_and_bar 2 30 foo_and_bar_2 3 4 foo_and_bar 4 6 foo_and_bar_2 und verwenden split() auf die Spalte "type" von oben zu
4
Antworten
Was ist der Unterschied zwischen = und ==? Ich habe Fälle festgestellt, in denen die doppelte Gleichheitszeichen wird zulassen, dass mein Skript ausgeführt werden, während ein Gleichheitszeichen erzeugt eine Fehlermeldung. Wann sollte ich == statt =? =
12
Antworten
R bietet zwei verschiedene Methoden für den Zugriff auf die Elemente einer Liste oder eines data.Rahmen - die und [ Betreiber. Was ist der Unterschied zwischen den beiden? In welchen Situationen sollte ich einen über den
16
Antworten
Möchte ich entfernen Sie die Zeilen in diesem data-frame: a) enthalten NAs über alle Spalten. Unten ist meine Beispiel-Daten-frame. gene hsap mmul mmus rnor cfam 1 ENSG00000208234 0 NA NA NA NA 2 ENSG00000199674 0 2 2
12
Antworten
Wie kann ich die Verkettung (merge, combine) zwei Werte? Ich habe zum Beispiel: tmp = cbind("GAD", "AB") tmp # [,1] [,2] # [1,] "GAD" "AB" Mein Ziel ist es, verketten Sie die beiden Werte in "tmp" zu
5
Antworten
Zum Beispiel wenn ich diese habe: n = c(2, 3, 5) s = c("aa", "bb", "cc") b = c(TRUE, FALSE, TRUE) df = data.frame(n, s, b) n s b 1 2 aa TRUE 2 3 bb FALSE
1
Antworten
Ich würde gerne verschieben Sie mehrere R-Bibliotheken (*) von einem Laufwerk auf ein anderes, auf Linux, und würde gerne wissen, ob ein verschieben möglich ist und sicher oder sollte ich deinstallieren und neu installieren der Pakete. Ich
5
Antworten
Schreibe ich codes zum exportieren der Datenbank von R in Excel, ich habe auch schon versucht andere codes, einschließlich: write.table(ALBERTA1, "D:/ALBERTA1.txt", sep="\t") write.csv(ALBERTA1,":\ALBERTA1.csv") your_filename_in_R = read.csv("ALBERTA1.csv") your_filename_in_R = read.csv("ALBERTA1.csv") write.csv(df, file = "ALBERTA1.csv") your_filename_in_R = read.csv("ALBERTA1.csv") write.csv(ALBERTA1,
3
Antworten
Ich habe ein ziemlich großes Daten-frame, über 10 Millionen Zeilen. Es hat Spalten x und y, und was ich will, ist zu berechnen hypot <- function(x) {sqrt(x[1]^2 + x[2]^2)} für jede Zeile. Mit apply es würde eine
3
Antworten
Habe ich einen großen Daten-frame etwa so aussieht: df <- data.frame(dive=factor(sample(c("dive1","dive2"),10,replace=TRUE)),speed=runif(10)) > df dive speed 1 dive1 0.80668490 2 dive1 0.53349584 3 dive2 0.07571784 4 dive2 0.39518628 5 dive1 0.84557955 6 dive1 0.69121443 7 dive1 0.38124950 8
5
Antworten
Hier ist ein Vektor a <- c(TRUE, FALSE, FALSE, NA, FALSE, TRUE, NA, FALSE, TRUE) Möchte ich eine einfache Funktion, die zurückgibt TRUE gibt es jedes mal eine TRUE im "ein", und FALSE gibt es jedes mal
2
Antworten
Scheint es einen Unterschied zwischen den Ebenen und Etiketten ein Faktor in R. Bis jetzt dachte ich immer, dass die Ebenen waren der 'echte' name der Faktor-Stufen und der Etiketten wurden die Namen für die Ausgabe (z.B.
8
Antworten
Ich bin versucht zu ermitteln, ob ein string ist eine Teilmenge eines anderen Strings ist. Zum Beispiel: chars <- "test" value <- "es" Ich soll den Wert TRUE zurück, wenn "Wert" wird als Teil der Zeichenfolge "chars".
9
Antworten
Nehmen wir an, wir haben einen Ordner mit mehreren Daten.csv-Dateien, die jeweils die gleiche Anzahl von Variablen, aber jeder aus unterschiedlichen Zeiten. Gibt es eine Möglichkeit in R importieren Sie alle gleichzeitig, anstatt Sie zu importieren, Sie
13
Antworten
Ich bin mit R unter Windows nicht als administrator. Wenn ich ein Paket installieren, das folgende Kommando funktioniert nicht: > install.packages("zoo") Installing package(s) into ‘C:/Program Files/R/R-2.15.2/library’ (as ‘lib’ is unspecified) Warning in install.packages : 'lib = "C:/Program
4
Antworten
Kann jemand mir bitte sagen, wie zu Lesen nur die ersten 6 Monate (7 Spalten) für jedes Jahr der die unten stehenden Daten, zum Beispiel durch Verwendung von read.table()? Year Jan Feb Mar Apr May Jun Jul
2
Antworten
Wird der Vektor wie diese: c(1,2,3) #[1] 1 2 3 Brauche ich so etwas wie dieses: list(1,2,3) #[[1]] #[1] 1 # #[[2]] #[1] 2 # #[[3]] #[1] 3 Habe ich versucht, dieses: list(c(1,2,3)) #[[1]] #[1] 1 2
2
Antworten
Ich habe eine große CSV mit den Ergebnissen einer ärztlichen Befragung von verschiedenen Standorten aus (der Standort ist ein Faktor in den Daten vorhanden). Einige Analysen sind auf einen bestimmten Standort und für die Bequemlichkeit, würde ich
1
Antworten
In diesem thread, ich versuche alle Häufig gestellten Fragen und Ihre Antworten hier. Ich hoffe, dies wird nützlich sein für jemanden. Allgemeine Frage: so erstellen Sie Sequenzen von r Objekte aus n Objekte? Kombination vs permutation. mit
8
Antworten
Habe ich eine Reihe von Daten, die wie folgt aussieht: anim <- c(25499,25500,25501,25502,25503,25504) sex <- c(1,2,2,1,2,1) wt <- c(0.8,1.2,1.0,2.0,1.8,1.4) data <- data.frame(anim,sex,wt) data anim sex wt anim2 1 25499 1 0.8 2 2 25500 2 1.2 2
5
Antworten
Ich habe versucht, dies zu tun, einfache Suche, konnte aber nichts finden, was auf die Prozent ( % ) - symbol in R. Was bedeutet %in% bedeuten im folgenden code? time(x) %in% time(y) wo x und y
7
Antworten
Gegeben zwei data frames: df1 = data.frame(CustomerId = c(1:6), Product = c(rep("Toaster", 3), rep("Radio", 3))) df2 = data.frame(CustomerId = c(2, 4, 6), State = c(rep("Alabama", 2), rep("Ohio", 1))) df1 # CustomerId Product # 1 Toaster # 2
9
Antworten
Sagen, dass ich eine data.frame Objekt: df <- data.frame(name=c('black','black','black','red','red'), type=c('chair','chair','sofa','sofa','plate'), num=c(4,5,12,4,3)) Nun möchte ich die Anzahl der Beobachtungen für jede Kombination von name und type. Diese kann getan werden, etwa so: table(df[ , c("name","type")]) bzw. evtl. auch
2
Antworten
Sah ich in einem tutorial über regression modellieren Sie den folgenden Befehl : myFormula <- Species ~ Sepal.Length + Sepal.Width + Petal.Length + Petal.Width Was genau macht dieser Befehl tun, und was ist die Rolle der ~
5
Antworten
Ja, ich weiß, warum wir immer Runde auf die nächste gerade Zahl, wenn wir exakt in der Mitte (d.h. 2.5 wird auf 2) von zwei zahlen. Aber wenn ich will, Daten zu bewerten, die für einige Menschen,
1
Antworten
Ich versuche zu schreiben, eine Funktion in R zu batch-analysieren eine Anzahl von Dateien in einer ähnlichen Weise. Die Dateien sind von der Klasse ExpressionSetIllumina. Ich kann einen Charakter (string) Vektor mit den Namen aller Dateien in
9
Antworten
Ich habe Probleme beim umstellen der folgenden Daten Rahmen: set.seed(45) dat1 <- data.frame( name = rep(c("firstName", "secondName"), each=4), numbers = rep(1:4, 2), value = rnorm(8) ) dat1 name numbers value 1 firstName 1 0.3407997 2 firstName 2
16
Antworten
Ich würde gerne Grundstück y1 und y2 in der gleichen Grundstück. x <- seq(-2, 2, 0.05) y1 <- pnorm(x) y2 <- pnorm(x, 1, 1) plot(x, y1, type = "l", col = "red") plot(x, y2, type = "l",
8
Antworten
Möchte ich aufteilen, einen Daten-frame in mehrere kleinere. Das sieht aus wie eine sehr triviale Frage, aber ich kann nicht finden, eine Lösung, von der web-Suche. nie verstanden split(), aber mit ntile aus dplyr und dann die
7
Antworten
Wie mache ich eine Liste von Daten-frames und wie bekomme ich Zugang zu jeder dieser Daten-frames von der Liste? Zum Beispiel, wie kann ich diese Daten-frames in einer Liste ? d1 <- data.frame(y1 = c(1, 2, 3),
2
Antworten
Habe ich einen Daten-frame mit einer kontinuierlichen, numerischen Variablen, Alter in Monaten (age_mnths). Ich möchte eine diskrete variable, die mit dem Alter Kategorien, basierend auf Alter Abständen. # Some example data rota2 <- data.frame(age_mnth = 1:170) Habe
12
Antworten
Ich habe einen dataframe, und ich möchte die Anzahl der Zeilen in jeder Gruppe. Ich OIN verwenden Sie die aggregate - Funktion, um die Summe von Daten wie folgt: df2 <- aggregate(x ~ Year + Month, data
13
Antworten
Sagen wir, ich habe zwei Spalten mit Daten. Die erste enthält Kategorien wie "Erstens", "Zweitens", "Drittens", etc.. Die zweite hat die zahlen repräsentieren die Anzahl der Male, die ich sah "Ersten". Beispiel: Category Frequency First 10 First
4
Antworten
Habe ich einen Daten-frame, etwa so: data.frame(director = c("Aaron Blaise,Bob Walker", "Akira Kurosawa", "Alan J. Pakula", "Alan Parker", "Alejandro Amenabar", "Alejandro Gonzalez Inarritu", "Alejandro Gonzalez Inarritu,Benicio Del Toro", "Alejandro González Iñárritu", "Alex Proyas", "Alexander Hall", "Alfonso Cuaron",
6
Antworten
Folgende code ist natürlich falsch. Was ist das problem? i <- 0.1 i <- i + 0.05 i ## [1] 0.15 if(i==0.15) cat("i equals 0.15") else cat("i does not equal 0.15") ## i does not equal 0.15
7
Antworten
Ich habe einen dataframe in einem breiten format, mit wiederholten Messungen, die innerhalb von unterschiedlichen Zeiträumen. In meinem Beispiel gibt es drei verschiedene Zeiträume, die alle mit Ihren entsprechenden Werten. E. g. die erste Messung (Value1) gemessen
10
Antworten
Dies soll eine FAQ-Frage, also bitte so vollständig wie möglich sein. Die Antwort ist eine Gemeinschaft beantworten, so fühlen sich frei zu Bearbeiten, wenn Sie denken, dass etwas fehlt. Diese Frage wurde diskutiert und genehmigt, meta. Bin
13
Antworten
Habe ich einen Daten-frame mit einem Faktor. Wenn ich eine Teilmenge dieser Daten-frame mit subset() oder andere Indizierung Funktion, zu einem neuen data frame erstellt wird. Jedoch, die Faktor-variable behält alle seine ursprünglichen Ebenen-auch wenn man es
3
Antworten
R s duplicated wird ein Vektor, der anzeigt, ob jedes element in einem Vektor oder data frame ist eine doppelte, der ein element mit einem kleineren index. Also, wenn die Zeilen 3, 4 und 5 einer 5-Zeilen-Daten-frame
19
Antworten
Ich habe eine Reihe von Spalten, die möchte ich entfernen, aus einem Daten-frame. Ich weiß, dass wir löschen können, die Sie einzeln mit so etwas wie: df$x <- NULL Aber ich hatte gehofft, dies mit weniger Befehle.
7
Antworten
Ein Freund hat mich auf diese tolle Anleitung auf webscraping NYtimes mit R. Ich würde wirklich gerne, es zu versuchen. Aber, der erste Schritt ist, installiert ein Paket mit dem Namen RJSONIO von der Quelle. Ich weiß
7
Antworten
Wie um zu überprüfen, ob ein Vektor enthält einen Wert? manchmal Frage ich mich, warum die R funktioniert einfach nicht, das Wort enthält, um es den Benutzern einfacher Bedenken Sie, dass "in" ist enthalten in "conta(in)s"; ich
3
Antworten
Ich habe einen dataframe mit ein paar Säulen, eine von diesen Spalten Reihen, eine ganze Zahl zwischen 1 und 20. Ich will erstellen Sie eine weitere Spalte, die enthält einen bin-Wert wie "1-4", "5-10", "11-15", "16-20". Was
3
Antworten
War ich endlich in der Lage zu arbeiten, den code für meine Schaben. Es schien zu funktionieren gut und dann ganz plötzlich, als ich lief es wieder, ich bekam die folgende Fehlermeldung: Error in url[i] = paste("http://en.wikipedia.org/wiki/",
8
Antworten
Bin ich in Probleme laufen, die versuchen, große Objekte in R. Zum Beispiel: > memory.limit(4000) > a = matrix(NA, 1500000, 60) > a = matrix(NA, 2500000, 60) > a = matrix(NA, 3500000, 60) Error: cannot allocate vector
4
Antworten
Habe ich zwei Daten-sets, die eigentlich die gleiche Größe haben, es aber nicht sind. Ich trimmen müssen die Werte von A, die nicht in B und Umgekehrt, um die Eliminierung von Rauschen aus einem Diagramm, wird in
9
Antworten
Ich versuche, R zur Berechnung des gleitenden Durchschnitts über eine Reihe von Werten in einer matrix. Die normalen R-mailing Liste-Suche war nicht sehr hilfreich, aber. Es scheint nicht zu einem built-in-Funktion in R wird mir erlauben, berechnen