Tag: dplyr
Verwenden Sie dieses tag für Fragen in Bezug auf Funktionen aus dem Paket dplyr, wie group_by, zusammenfassen, filtern und auswählen.
5
Antworten
Wenn durch das pipe-operator %>% mit Paketen wie dplyr, ggvis, dycharts usw, wie mache ich ein Schritt bedingt? Zum Beispiel; step_1 %>% step_2 %>% if(condition) step_3 Diese Ansätze scheinen nicht zu funktionieren: step_1 %>% step_2 if(condition) %>%
3
Antworten
Habe ich eine längs-follow-up der Blutdruck Aufnahmen. Den Wert an einem bestimmten Punkt ist weniger prädiktive als ist der gleitende Durchschnitt (rollender Mittelwert), die ist, warum ich mag würde, zu berechnen. Die Daten Aussehen test <- read.table(header=TRUE,
4
Antworten
Es gibt andere Beiträge über row-wise Operatoren auf datatable. Sie sind entweder zu einfach oder löst eine spezifische Szenario Hier meine Frage ist mehr allgemein. Es ist eine Lösung mit dplyr. Ich habe rumprobiert aber konnte nicht
3
Antworten
Kann ich zusammenfassen, dass meine Daten, und berechnen Sie Mittelwert und die sd-Werte mit: summary <- aspen %>% group_by(year,Spp,CO2) %>% summarise_each(funs(mean,sd)) Kann ich jedoch nicht zu verwalten, zu berechnen, standard-Fehler als auch. Ich versuchte dies ohne Erfolg:
1
Antworten
Angenommen ich habe die folgenden Daten: id grpvar1 grpvar2 value 1 1 3 7.6 2 1 2 4 ... 3 1 5 2 Für jeden id möchte ich die Berechnung der percent_rank() seiner value innerhalb der Gruppe
3
Antworten
Kann ich definieren Sie eine "fill" - Wert für NA in dplyr beitreten? Zum Beispiel in der Verknüpfung festlegen, dass alle NA-Werte sollten 1? require(dplyr) lookup <- data.frame(cbind(c("USD","MYR"),c(0.9,1.1))) names(lookup) <- c("rate","value") fx <- data.frame(c("USD","MYR","USD","MYR","XXX","YYY")) names(fx)[1] <- "rate"
1
Antworten
plyr::mapvalues kann z.B. so verwendet werden: mapvalues(mtcars$cyl, c(4, 6, 8), c("a", "b", "c")) Aber das funktioniert nicht: mtcars %>% dplyr::select(cyl) %>% mapvalues(c(4, 6, 8), c("a", "b", "c")) %>% as.data.frame() Wie kann ich plyr::mapvalues mit dplyr? Oder noch
2
Antworten
Ich habe ein Probleme beim extrahieren der Weg von einer ggplot - und bin stecken mit einem Fehler. Dem Bild da unten erläutert, das Ergebnis ich bin auf der Suche nach: (Fertig in-Bild-editor für die Erklärung der
3
Antworten
Arbeite ich mit R shiny für einige explorative Daten-Analyse. Ich habe zwei Kontrollkästchen Eingänge,die in eine checkbox, die ich am Auffüllen alle kategorialen Variablen und in anderen sind alle numerischen Variablen. Dann bewerbe ich mich groupby auf
4
Antworten
Ich habe einen dataframe mit einer Spalte mit strings und wollen zum extrahieren von Teilzeichenfolgen dieser in einer neuen Spalte. Ist hier einige Beispiel-code und Daten, die zeigen, will ich den string nach dem letzten Unterstrich-Zeichen in
6
Antworten
Möchte ich lösen das folgende problem mit dplyr. Vorzuziehen, mit der man die Fenster-Funktionen. Ich habe einen Daten-frame mit Häuser-und Kaufpreise. Das folgende ist ein Beispiel: houseID year price 1 1995 NA 1 1996 100 1 1997
2
Antworten
Ich versuche zu berechnen, die Mitte der jeweiligen Gruppe durch ausführen der calc_center Funktion mit dplyr's group_by_ und summarise Funktionen. Allerdings erhielt ich eine Fehlermeldung, dass muss die Spalte 1 Spalte nicht zwei. Was kann ich tun,
1
Antworten
Dies ist der Blick() von meinem dataframe DF: Observations: 221184 Variables: $ Epsilon (fctr) 96002.txt, 96002.txt, 96004.txt, 96004.txt, 96005.txt, 960... $ Value (int) 61914, 61887, 61680, 61649, 61776, 61800, 61753, 61725, 616... Möchte ich filtern (entfernen) alle
1
Antworten
Bin ich angefangen zu genießen dplyr aber ich habe fest auf einen use-case. Ich möchte in der Lage sein zu gelten cumsum pro Gruppe in einem dataframe mit dem Paket aber ich kann nicht scheinen, um es
3
Antworten
Wenn ich dplyr syntax auf der Spitze eines datatable, bekomme ich alle die Geschwindigkeit Vorteile der datatable, während immer noch mit der syntax von dplyr? In anderen Worten, ich mis-verwenden Sie die datatable, wenn ich die Abfrage
6
Antworten
Ich habe einen Datensatz, der wie folgt aussieht. bankname bankid year totass cash bond loans Bank A 1 1881 244789 7250 20218 29513 Bank B 2 1881 195755 10243 185151 2800 Bank C 3 1881 107736 13357
1
Antworten
So, ich habe versucht, zu verwenden left_join, um die Spalten einer neuen dataset auf mein Haupt-dataset (sogenannte Arbeitnehmer) Habe ich überprüft, die Vektor-Namen und die Reinigung habe ich nicht, und nichts scheint zu funktionieren. Hier ist mein
3
Antworten
Ich habe die Dokumentation gelesen und ich habe versucht zu googeln; es sollte eine einfache Sache, aber es würde scheinen, es ist nicht an mir, so daß ich kühn hingehen und Fragen, ob jemand hier könnte mir
2
Antworten
Lassen Sie mich Ihnen ein Beispiel von, was ich versuche zu tun, da der Titel vielleicht nicht so deutlich, wie ich möchte, es zu werden. Diese nicht reproduzierbaren code, aber ich kann hinzufügen, eine reproduzierbare Beispiel, wenn
4
Antworten
Habe ich folgende Daten Rahmen: df <- structure(list(BoneMarrow = c(30, 0, 0, 31138, 2703), Pulmonary = c(3380, 21223.3333333333, 0, 0, 27)), row.names = c("ATP1B1", "CYCS", "DDX5", "GNB2L1", "PRR11"), class = "data.frame", .Names = c("BoneMarrow", "Pulmonary")) df #>
4
Antworten
Diese Frage ist etwas zu Fragen Effizient Zusammenführen von zwei Daten-frames auf einen nicht-trivialen Kriterien und Prüfen ob Datum zwischen zwei Daten in r. Und die, die ich gepostet haben, hier anfordern, falls die Funktion vorhanden ist:
3
Antworten
Habe ich folgende Daten: Name <- c("Sam", "Sarah", "Jim", "Fred", "James", "Sally", "Andrew", "John", "Mairin", "Kate", "Sasha", "Ray", "Ed") Age <- c(22,12,31,35,58,82,17,34,12,24,44,67,43) Group <- c("A", "B", "B", "B", "B", "C", "C", "D", "D", "D", "D", "D", "D")
4
Antworten
Möchte ich verweisen auf eine unbekannte Spalte Namen im summarise. Die standard-evaluation-Funktionen eingeführt, die in dplyr 0.3 ermöglichen Spaltennamen referenziert werden mit Hilfe von Variablen, aber das scheint nicht zu funktionieren, wenn Sie anrufen, eine base R
5
Antworten
Für ein Daten.Rahmen mit n Spalten, ich möchte in der Lage sein, um eine Spalte aus jedem der 1-(n-1) Positionen, werden die N-TEN Spalte (d.h. eine nicht-letzten Spalte in der letzten Spalte). Ich möchte auch, es zu
1
Antworten
Sagen, ich habe einen Datensatz so: id <- c(1, 1, 2, 2, 3, 3) code <- c("a", "b", "a", "a", "b", "b") dat <- data.frame(id, code) I. e., id code 1 1 a 2 1 b 3
3
Antworten
Ich verwenden möchten, verwenden Sie die dplyr::group_by Funktion innerhalb einer anderen Funktion, aber ich weiß nicht, wie der übergabe von Argumenten an diese Funktion. Kann mir jemand eine gute Beispiel? library(dplyr) data(iris) iris %.% group_by(Species) %.% summarise(n
4
Antworten
Habe ich einen Daten-frame, die ist angeordnet in absteigender Reihenfolge der Datum. ps1 = data.frame(userID = c(21,21,21,22,22,22,23,23,23), color = c(NA,'blue','red','blue',NA,NA,'red',NA,'gold'), age = c('3yrs','2yrs',NA,NA,'3yrs',NA,NA,'4yrs',NA), gender = c('F',NA,'M',NA,NA,'F','F',NA,'F') ) Möchte ich unterstellen(ersetzen) NA Werte mit früheren Werten und gruppiert
4
Antworten
Möchte ich (1) - Gruppe-Daten von einer variable (State), (2) innerhalb jeder Gruppe finden, die die Reihe von minimum-Wert der anderen variable (Employees), und (3) extrahieren Sie die gesamte Zeile. (1) und (2) sind einfache Einzeiler, und
2
Antworten
Ich verwenden möchte, dplyr ' s mutate_at Funktion anwenden einer Funktion auf mehrere Spalten in einem dataframe, wo die Funktion Eingänge der Spalte zu, die es unmittelbar angewendet werden, sowie eine weitere Spalte in der dataframe. Als
1
Antworten
Diese Fragen müssen beantwortet sein, bevor, aber ich kann es nicht finden, wo jeder. Ich brauche die filter - /Teilmenge ein dataframe mit Werten in zwei Spalten, um Sie zu entfernen. In den Beispielen die ich behalten
1
Antworten
Ich will das filter() Funktion zu finden, die Typen, die haben ein x-Wert weniger als oder gleich 4 ist, ODER ein y-Wert größer als 5 ist. Ich denke, das könnte eine einfache Lösung ich einfach nicht finden
1
Antworten
Den code unten sollten gruppieren Sie die Daten nach Jahr und dann erstellen Sie zwei neue Spalten mit den ersten und den letzten Wert jedes Jahr. library(dplyr) set.seed(123) d <- data.frame( group = rep(1:3, each = 3),
1
Antworten
Dies ist mein dataset N Pl 10, WO 20, EI 10, WO 20, WO 30, EI Meine erwartete Ausgabe ist N Pl 10, 2 20, 1 30, 1 Also, im Grunde, ich zähle die Anzahl der pl
1
Antworten
Mein dataframe a1 <- c("a","a","b","b","c","d","e","e") b2 <- c("01.01.2015", "02.02.2015", "14.02.2012", "16.08.2008", "17.06.2003", "31.01.2015", "07.01.2022", "09.05.2001") c3 <- c("1a", "2b", "3c", "4d", "5e", "6f", "7g", "8h") d3 <- c(1:8) df2 <- data.frame(a1,b2,c3,d3, stringsAsFactors = F) Mein code. library(dplyr)
1
Antworten
Ich versuche, mit dplyr-Berechnung als unten und dann rufen Sie diese in einer Funktion, wo ich das ändern kann der name der Spalte und der dataset-name. Der code ist wie folgt:- sample_table <- function(byvar = TRUE, dataset
2
Antworten
Ich habe ein Problem mit der mutate Funktion in dplyr und der Fehler sagt; Error: incompatible size (0), expecting 5 (the group size) or 1 Gibt es einige frühere posts und ich habe versucht, einige der Lösungen,
3
Antworten
Ich würde das konvertieren einer strukturierten Liste in eine ordentliche dataFrame mit der Geschwindigkeit des dplyr-package. Ich möchte wissen, ob die Lösung bin ich die Buchung jetzt "state-of-art" oder gibt ' s etwas schneller. hier ist ein
3
Antworten
Ich versuche zu löschen, bestimmte Zeilen in mein dataset anhand der Werte in mehrere Spalten. Eine Zeile sollte nur gelöscht werden, wenn eine Bedingung in allen 3 Spalten erfüllt ist. Dies ist mein code: test_dff %>% filter(contbr_nm
1
Antworten
Habe ich einen Daten-frame df hat zwei Spalten, Begriff und Frequenz. Ich habe auch eine Liste der Begriffe, die mit bestimmten IDs gespeichert in einem Vektor namens indices. Zur Veranschaulichung dieser zwei info, ich habe die folgenden:
3
Antworten
Habe ich ein Beispiel-Datensatz mit einer Spalte, liest sich etwas wie dieses: Candy Sanitizer Candy Water Cake Candy Ice Cream Gum Candy Coffee Was ich möchte zu tun ist, ersetzen Sie es in nur zwei Faktoren -
2
Antworten
Schreibe ich eine Funktion, wo der Nutzer aufgefordert wird, zum definieren eines oder mehrerer der Gruppierung Variablen in den Funktionsaufruf. Die Daten werden dann gruppiert mit dplyr und es funktioniert wie erwartet, wenn es nur eine Gruppierung
6
Antworten
Scheint es dplyr::case_when verhält sich nicht wie andere Befehle in einer dplyr::mutate nennen. Zum Beispiel: library(dplyr) case_when(mtcars$carb <= 2 ~ "low", mtcars$carb > 2 ~ "high") %>% table funktioniert: . high low 15 17 Aber setzen case_when
4
Antworten
Möchte ich verweisen auf eine unbekannte Spalte Namen im summarise. Die standard-evaluation-Funktionen eingeführt, die in dplyr 0.3 ermöglichen Spaltennamen referenziert werden mit Hilfe von Variablen, aber das scheint nicht zu funktionieren, wenn Sie anrufen, eine base R
1
Antworten
Hallo, ich bin neu in r ich habe ein problem ich.e zu finden, das Netzwerk des Benutzers(uID) und das Netzwerk Artikel(faID) aus einem data frame namens w2 wie faID uID 1 1256 1 54789 1 547821 2
2
Antworten
Situation Habe ich einen Daten-frame df mit zwei Variablen ReportYear und Salary. dput(df) structure(list(ReportYear = structure(c(2012, 2012, 2012, 2012, 2012, 2012, 2012, 2012, 2012, 2012, 2012, 2012, 2012, 2012, 2012, 2012, 2012, 2012, 2012, 2012, 2012, 2012,
3
Antworten
Habe ich diese Daten: > str(gaDataExt) Classes ‘tbl_df’, ‘tbl’ and 'data.frame': 2 obs. of 5 variables: $ date : POSIXct, format: "2016-05-24" "2016-05-31" $ deviceCategory: chr "desktop" "desktop" $ users : int 1 2 $ sessions :
5
Antworten
Habe ich mehrere Variablen in meinem dataframe. Ich möchte, um zu überprüfen, die eine einzelne Frequenz Grafen von einige der ausgewählten Variablen mehr aus QA-Sicht von großen Datenmengen.e.g ID Q1 Q2 Q3 1 1 2 3 2
1
Antworten
Ich übe das dplyr-package mit bekannten Datensatz aus ggplot2, 'diamonds' - Daten. Ich bin versucht zu berechnen, bedeutet "Preis" des Diamanten gruppiert nach Variablen 'cut'. Mein code ist wie folgt. price.cut <- diamonds %>% group_by(cut) %>% summarize(Mean
3
Antworten
Habe ich einen Daten-frame 'test', die wie folgt Aussehen: session_id seller_feedback_score 1 1 282470 2 1 275258 3 1 275258 4 1 275258 5 1 37831 6 1 282470 7 1 26 8 1 138351 9 1
2
Antworten
Mit arrange Funktion in dplyr können wir arrangieren Zeile in aufsteigender oder absteigender Reihenfolge. Die Frage, wie ordnen Sie die Zeilen in benutzerdefinierten Reihenfolge. Bitte sehen MWE. Reg <- rep(LETTERS[1:3], each = 2) Res <- rep(c("Urban", "Rural"),