Tag: dplyr

Verwenden Sie dieses tag für Fragen in Bezug auf Funktionen aus dem Paket dplyr, wie group_by, zusammenfassen, filtern und auswählen.

R Bedingte Auswertung bei Verwendung der pipe-operator %>%

Anzahl der Antworten

5 Antworten

Wenn durch das pipe-operator %>% mit Paketen wie dplyr, ggvis, dycharts usw, wie mache ich ein Schritt bedingt? Zum Beispiel; step_1 %>% step_2 %>% if(condition) step_3 Diese Ansätze scheinen nicht zu funktionieren: step_1 %>% step_2 if(condition) %>%

dplyr ggvis magrittr r

Rolling-Mittelwert (moving average) von der Gruppe/id mit dplyr

Anzahl der Antworten

3 Antworten

Habe ich eine längs-follow-up der Blutdruck Aufnahmen. Den Wert an einem bestimmten Punkt ist weniger prädiktive als ist der gleitende Durchschnitt (rollender Mittelwert), die ist, warum ich mag würde, zu berechnen. Die Daten Aussehen test <- read.table(header=TRUE,

Daten.Tabelle zeilenweise Summe, Mittelwert, min, max, wie dplyr?

Anzahl der Antworten

4 Antworten

Es gibt andere Beiträge über row-wise Operatoren auf datatable. Sie sind entweder zu einfach oder löst eine spezifische Szenario Hier meine Frage ist mehr allgemein. Es ist eine Lösung mit dplyr. Ich habe rumprobiert aber konnte nicht

data.table dplyr r

dplyr summarise_each standard-error-Funktion

Anzahl der Antworten

3 Antworten

Kann ich zusammenfassen, dass meine Daten, und berechnen Sie Mittelwert und die sd-Werte mit: summary <- aspen %>% group_by(year,Spp,CO2) %>% summarise_each(funs(mean,sd)) Kann ich jedoch nicht zu verwalten, zu berechnen, standard-Fehler als auch. Ich versuchte dies ohne Erfolg:

Verwenden dplyr::percent_rank() zur Berechnung Perzentil Ränge innerhalb der Gruppe

Anzahl der Antworten

1 Antworten

Angenommen ich habe die folgenden Daten: id grpvar1 grpvar2 value 1 1 3 7.6 2 1 2 4 ... 3 1 5 2 Für jeden id möchte ich die Berechnung der percent_rank() seiner value innerhalb der Gruppe

dplyr-join definieren, die NA-Werte

Anzahl der Antworten

3 Antworten

Kann ich definieren Sie eine "fill" - Wert für NA in dplyr beitreten? Zum Beispiel in der Verknüpfung festlegen, dass alle NA-Werte sollten 1? require(dplyr) lookup <- data.frame(cbind(c("USD","MYR"),c(0.9,1.1))) names(lookup) <- c("rate","value") fx <- data.frame(c("USD","MYR","USD","MYR","XXX","YYY")) names(fx)[1] <- "rate"

dplyr left-join na r

Mit plyr::mapvalues mit dplyr

Anzahl der Antworten

1 Antworten

plyr::mapvalues kann z.B. so verwendet werden: mapvalues(mtcars$cyl, c(4, 6, 8), c("a", "b", "c")) Aber das funktioniert nicht: mtcars %>% dplyr::select(cyl) %>% mapvalues(c(4, 6, 8), c("a", "b", "c")) %>% as.data.frame() Wie kann ich plyr::mapvalues mit dplyr? Oder noch

dataframe dplyr plyr r

Fehler in ggplot.Daten.Rahmen : Mapping erstellt werden soll, die mit aes oder aes_string

Anzahl der Antworten

2 Antworten

Ich habe ein Probleme beim extrahieren der Weg von einer ggplot - und bin stecken mit einem Fehler. Dem Bild da unten erläutert, das Ergebnis ich bin auf der Suche nach: (Fertig in-Bild-editor für die Erklärung der

dplyr ggplot2 r zoo

dplyr Gruppe von über mehrere Spalten durch die übergabe Gruppierung Variablennamen als strings

Anzahl der Antworten

3 Antworten

Arbeite ich mit R shiny für einige explorative Daten-Analyse. Ich habe zwei Kontrollkästchen Eingänge,die in eine checkbox, die ich am Auffüllen alle kategorialen Variablen und in anderen sind alle numerischen Variablen. Dann bewerbe ich mich groupby auf

dplyr group-by r shiny

Erstellen neuer Spalte mit dplyr mutieren und substring der vorhandenen Spalte

Anzahl der Antworten

4 Antworten

Ich habe einen dataframe mit einer Spalte mit strings und wollen zum extrahieren von Teilzeichenfolgen dieser in einer neuen Spalte. Ist hier einige Beispiel-code und Daten, die zeigen, will ich den string nach dem letzten Unterstrich-Zeichen in

dplyr r strsplit

Ersetzen der fehlenden Werte (NA) mit den meisten neueren nicht-NA von Gruppe

Anzahl der Antworten

6 Antworten

Möchte ich lösen das folgende problem mit dplyr. Vorzuziehen, mit der man die Fenster-Funktionen. Ich habe einen Daten-frame mit Häuser-und Kaufpreise. Das folgende ist ein Beispiel: houseID year price 1 1995 NA 1 1996 100 1 1997

R - Fehler in summarise_impl(.Daten, Punkte) : Spalte `Mitte` muss Länge 1 (ein zusammenfassender Wert), nicht 2

Anzahl der Antworten

2 Antworten

Ich versuche zu berechnen, die Mitte der jeweiligen Gruppe durch ausführen der calc_center Funktion mit dplyr's group_by_ und summarise Funktionen. Allerdings erhielt ich eine Fehlermeldung, dass muss die Spalte 1 Spalte nicht zwei. Was kann ich tun,

Filter-Faktor-Stufen in R mit dplyr

Anzahl der Antworten

1 Antworten

Dies ist der Blick() von meinem dataframe DF: Observations: 221184 Variables: $ Epsilon (fctr) 96002.txt, 96002.txt, 96004.txt, 96004.txt, 96005.txt, 960... $ Value (int) 61914, 61887, 61680, 61649, 61776, 61800, 61753, 61725, 616... Möchte ich filtern (entfernen) alle

r cumsum pro Gruppe in dplyr

Anzahl der Antworten

1 Antworten

Bin ich angefangen zu genießen dplyr aber ich habe fest auf einen use-case. Ich möchte in der Lage sein zu gelten cumsum pro Gruppe in einem dataframe mit dem Paket aber ich kann nicht scheinen, um es

dplyr ggplot2 r

dplyr auf die Daten.Tabelle, bin ich wirklich mit Daten.Tabelle?

Anzahl der Antworten

3 Antworten

Wenn ich dplyr syntax auf der Spitze eines datatable, bekomme ich alle die Geschwindigkeit Vorteile der datatable, während immer noch mit der syntax von dplyr? In anderen Worten, ich mis-verwenden Sie die datatable, wenn ich die Abfrage

data.table dplyr r

Mutieren Sie mehrere Spalten in einem dataframe

Anzahl der Antworten

6 Antworten

Ich habe einen Datensatz, der wie folgt aussieht. bankname bankid year totass cash bond loans Bank A 1 1881 244789 7250 20218 29513 Bank B 2 1881 195755 10243 185151 2800 Bank C 3 1881 107736 13357

Fehler mit R dplyr left_join

Anzahl der Antworten

1 Antworten

So, ich habe versucht, zu verwenden left_join, um die Spalten einer neuen dataset auf mein Haupt-dataset (sogenannte Arbeitnehmer) Habe ich überprüft, die Vektor-Namen und die Reinigung habe ich nicht, und nichts scheint zu funktionieren. Hier ist mein

dplyr join left-join r

Wie funktioniert dplyr zwischen arbeiten?

Anzahl der Antworten

3 Antworten

Ich habe die Dokumentation gelesen und ich habe versucht zu googeln; es sollte eine einfache Sache, aber es würde scheinen, es ist nicht an mir, so daß ich kühn hingehen und Fragen, ob jemand hier könnte mir

Verwenden Sie filter in dplyr bedingte auf eine if-Anweisung in R

Anzahl der Antworten

2 Antworten

Lassen Sie mich Ihnen ein Beispiel von, was ich versuche zu tun, da der Titel vielleicht nicht so deutlich, wie ich möchte, es zu werden. Diese nicht reproduzierbaren code, aber ich kann hinzufügen, eine reproduzierbare Beispiel, wenn

Wie zu bewahren base Daten-frame rownames beim filtern in dplyr-Kette

Anzahl der Antworten

4 Antworten

Habe ich folgende Daten Rahmen: df <- structure(list(BoneMarrow = c(30, 0, 0, 31138, 2703), Pulmonary = c(3380, 21223.3333333333, 0, 0, 27)), row.names = c("ATP1B1", "CYCS", "DDX5", "GNB2L1", "PRR11"), class = "data.frame", .Names = c("BoneMarrow", "Pulmonary")) df #>

dplyr left_join von weniger als, größer-als-Bedingung

Anzahl der Antworten

4 Antworten

Diese Frage ist etwas zu Fragen Effizient Zusammenführen von zwei Daten-frames auf einen nicht-trivialen Kriterien und Prüfen ob Datum zwischen zwei Daten in r. Und die, die ich gepostet haben, hier anfordern, falls die Funktion vorhanden ist:

dplyr left-join postgresql r sql

Wie zu verwenden Dplyr Zusammenfassen, und die () - lookup min - /max-Werte

Anzahl der Antworten

3 Antworten

Habe ich folgende Daten: Name <- c("Sam", "Sarah", "Jim", "Fred", "James", "Sally", "Andrew", "John", "Mairin", "Kate", "Sasha", "Ray", "Ed") Age <- c(22,12,31,35,58,82,17,34,12,24,44,67,43) Group <- c("A", "B", "B", "B", "B", "C", "C", "D", "D", "D", "D", "D", "D")

die standard-evaluation in dplyr: zusammenfassen einer Variablen als Zeichenkette

Anzahl der Antworten

4 Antworten

Möchte ich verweisen auf eine unbekannte Spalte Namen im summarise. Die standard-evaluation-Funktionen eingeführt, die in dplyr 0.3 ermöglichen Spaltennamen referenziert werden mit Hilfe von Variablen, aber das scheint nicht zu funktionieren, wenn Sie anrufen, eine base R

R Spalte verschieben, um die Letzte mit dplyr

Anzahl der Antworten

5 Antworten

Für ein Daten.Rahmen mit n Spalten, ich möchte in der Lage sein, um eine Spalte aus jedem der 1-(n-1) Positionen, werden die N-TEN Spalte (d.h. eine nicht-letzten Spalte in der letzten Spalte). Ich möchte auch, es zu

dplyr zählt die Anzahl der einen bestimmten Wert der variable

Anzahl der Antworten

1 Antworten

Sagen, ich habe einen Datensatz so: id <- c(1, 1, 2, 2, 3, 3) code <- c("a", "b", "a", "a", "b", "b") dat <- data.frame(id, code) I. e., id code 1 1 a 2 1 b 3

dplyr: Wie group_by innerhalb einer Funktion?

Anzahl der Antworten

3 Antworten

Ich verwenden möchten, verwenden Sie die dplyr::group_by Funktion innerhalb einer anderen Funktion, aber ich weiß nicht, wie der übergabe von Argumenten an diese Funktion. Kann mir jemand eine gute Beispiel? library(dplyr) data(iris) iris %.% group_by(Species) %.% summarise(n

Ersetzen NA mit dem vorherigen oder nächsten Wert, von der Gruppe, mit dplyr

Anzahl der Antworten

4 Antworten

Habe ich einen Daten-frame, die ist angeordnet in absteigender Reihenfolge der Datum. ps1 = data.frame(userID = c(21,21,21,22,22,22,23,23,23), color = c(NA,'blue','red','blue',NA,NA,'red',NA,'gold'), age = c('3yrs','2yrs',NA,NA,'3yrs',NA,NA,'4yrs',NA), gender = c('F',NA,'M',NA,NA,'F','F',NA,'F') ) Möchte ich unterstellen(ersetzen) NA Werte mit früheren Werten und gruppiert

dplyr missing-data r zoo

Extrakt Zeile entsprechenden minimalen Wert einer Variablen, der durch die Gruppe

Anzahl der Antworten

4 Antworten

Möchte ich (1) - Gruppe-Daten von einer variable (State), (2) innerhalb jeder Gruppe finden, die die Reihe von minimum-Wert der anderen variable (Employees), und (3) extrahieren Sie die gesamte Zeile. (1) und (2) sind einfache Einzeiler, und

aggregate data.table dplyr r

Über Funktionen von mehreren Spalten in einer dplyr mutate_at nennen

Anzahl der Antworten

2 Antworten

Ich verwenden möchte, dplyr ' s mutate_at Funktion anwenden einer Funktion auf mehrere Spalten in einem dataframe, wo die Funktion Eingänge der Spalte zu, die es unmittelbar angewendet werden, sowie eine weitere Spalte in der dataframe. Als

R: Filterung durch zwei Säulen mit "ist nicht gleich" - operator dplyr/Teilmenge

Anzahl der Antworten

1 Antworten

Diese Fragen müssen beantwortet sein, bevor, aber ich kann es nicht finden, wo jeder. Ich brauche die filter - /Teilmenge ein dataframe mit Werten in zwei Spalten, um Sie zu entfernen. In den Beispielen die ich behalten

ODER-operator in filter()?

Anzahl der Antworten

1 Antworten

Ich will das filter() Funktion zu finden, die Typen, die haben ein x-Wert weniger als oder gleich 4 ist, ODER ein y-Wert größer als 5 ist. Ich denke, das könnte eine einfache Lösung ich einfach nicht finden

dplyr filter operators r

die ersten und letzten Werte in der Gruppe – dplyr group_by mit last() und first()

Anzahl der Antworten

1 Antworten

Den code unten sollten gruppieren Sie die Daten nach Jahr und dann erstellen Sie zwei neue Spalten mit den ersten und den letzten Wert jedes Jahr. library(dplyr) set.seed(123) d <- data.frame( group = rep(1:3, each = 3),

data-manipulation dplyr r

Fehler mit dplyr group_by

Anzahl der Antworten

1 Antworten

Dies ist mein dataset N Pl 10, WO 20, EI 10, WO 20, WO 30, EI Meine erwartete Ausgabe ist N Pl 10, 2 20, 1 30, 1 Also, im Grunde, ich zähle die Anzahl der pl

aggregate dplyr r

Konvertieren-Spalte in Daten.frame to date

Anzahl der Antworten

1 Antworten

Mein dataframe a1 <- c("a","a","b","b","c","d","e","e") b2 <- c("01.01.2015", "02.02.2015", "14.02.2012", "16.08.2008", "17.06.2003", "31.01.2015", "07.01.2022", "09.05.2001") c3 <- c("1a", "2b", "3c", "4d", "5e", "6f", "7g", "8h") d3 <- c(1:8) df2 <- data.frame(a1,b2,c3,d3, stringsAsFactors = F) Mein code. library(dplyr)

date dplyr magrittr r

Fehler Alle auswählen () - Eingänge lösen muss, um die ganze Spalte Positionen. Die folgenden nicht:

Anzahl der Antworten

1 Antworten

Ich versuche, mit dplyr-Berechnung als unten und dann rufen Sie diese in einer Funktion, wo ich das ändern kann der name der Spalte und der dataset-name. Der code ist wie folgt:- sample_table <- function(byvar = TRUE, dataset

Fehler: inkompatible Größe, wenn Sie mutiert in dplyr

Anzahl der Antworten

2 Antworten

Ich habe ein Problem mit der mutate Funktion in dplyr und der Fehler sagt; Error: incompatible size (0), expecting 5 (the group size) or 1 Gibt es einige frühere posts und ich habe versucht, einige der Lösungen,

R: reorganisieren Liste in dataframe mit dplyr

Anzahl der Antworten

3 Antworten

Ich würde das konvertieren einer strukturierten Liste in eine ordentliche dataFrame mit der Geschwindigkeit des dplyr-package. Ich möchte wissen, ob die Lösung bin ich die Buchung jetzt "state-of-art" oder gibt ' s etwas schneller. hier ist ein

dataframe dplyr lapply list r

Löschen Sie Zeilen auf Grundlage mehrerer Bedingungen mit dplyr

Anzahl der Antworten

3 Antworten

Ich versuche zu löschen, bestimmte Zeilen in mein dataset anhand der Werte in mehrere Spalten. Eine Zeile sollte nur gelöscht werden, wenn eine Bedingung in allen 3 Spalten erfüllt ist. Dies ist mein code: test_dff %>% filter(contbr_nm

R: neue Spalte Hinzufügen, um dataframe mit der Funktion

Anzahl der Antworten

1 Antworten

Habe ich einen Daten-frame df hat zwei Spalten, Begriff und Frequenz. Ich habe auch eine Liste der Begriffe, die mit bestimmten IDs gespeichert in einem Vektor namens indices. Zur Veranschaulichung dieser zwei info, ich habe die folgenden:

Mit dplyr bedingt ersetzen von Werten in einer Spalte

Anzahl der Antworten

3 Antworten

Habe ich ein Beispiel-Datensatz mit einer Spalte, liest sich etwas wie dieses: Candy Sanitizer Candy Water Cake Candy Ice Cream Gum Candy Coffee Was ich möchte zu tun ist, ersetzen Sie es in nur zwei Faktoren -

dplyr::group_by_ mit Zeichenkette, Eingabe von mehreren Variablen-Namen

Anzahl der Antworten

2 Antworten

Schreibe ich eine Funktion, wo der Nutzer aufgefordert wird, zum definieren eines oder mehrerer der Gruppierung Variablen in den Funktionsaufruf. Die Daten werden dann gruppiert mit dplyr und es funktioniert wie erwartet, wenn es nur eine Gruppierung

case_when in Rohr mutieren

Anzahl der Antworten

6 Antworten

Scheint es dplyr::case_when verhält sich nicht wie andere Befehle in einer dplyr::mutate nennen. Zum Beispiel: library(dplyr) case_when(mtcars$carb <= 2 ~ "low", mtcars$carb > 2 ~ "high") %>% table funktioniert: . high low 15 17 Aber setzen case_when

die standard-evaluation in dplyr: summarise_ auf gegebene variable als Zeichenkette

Anzahl der Antworten

4 Antworten

Möchte ich verweisen auf eine unbekannte Spalte Namen im summarise. Die standard-evaluation-Funktionen eingeführt, die in dplyr 0.3 ermöglichen Spaltennamen referenziert werden mit Hilfe von Variablen, aber das scheint nicht zu funktionieren, wenn Sie anrufen, eine base R

Fehler "keine anwendbare Methode für 'umgruppieren' angewandt auf ein Objekt der Klasse "c('integer', 'numeric')""

Anzahl der Antworten

1 Antworten

Hallo, ich bin neu in r ich habe ein problem ich.e zu finden, das Netzwerk des Benutzers(uID) und das Netzwerk Artikel(faID) aus einem data frame namens w2 wie faID uID 1 1256 1 54789 1 547821 2

r dplyr-filter Fehler - Spalte hat, die nicht unterstützt werden

Anzahl der Antworten

2 Antworten

Situation Habe ich einen Daten-frame df mit zwei Variablen ReportYear und Salary. dput(df) structure(list(ReportYear = structure(c(2012, 2012, 2012, 2012, 2012, 2012, 2012, 2012, 2012, 2012, 2012, 2012, 2012, 2012, 2012, 2012, 2012, 2012, 2012, 2012, 2012, 2012,

Konvertieren Klassen 'tbl_df', 'tbl' und 'Daten.Rahmen in dataframe mit R

Anzahl der Antworten

3 Antworten

Habe ich diese Daten: > str(gaDataExt) Classes ‘tbl_df’, ‘tbl’ and 'data.frame': 2 obs. of 5 variables: $ date : POSIXct, format: "2016-05-24" "2016-05-31" $ deviceCategory: chr "desktop" "desktop" $ users : int 1 2 $ sessions :

Frequenz Anzahl der mehrfachen Variablen in R

Anzahl der Antworten

5 Antworten

Habe ich mehrere Variablen in meinem dataframe. Ich möchte, um zu überprüfen, die eine einzelne Frequenz Grafen von einige der ausgewählten Variablen mehr aus QA-Sicht von großen Datenmengen.e.g ID Q1 Q2 Q3 1 1 2 3 2

analysis dplyr frequency r

Berechnen Sie bedeuten von der Gruppe mit dplyr-package

Anzahl der Antworten

1 Antworten

Ich übe das dplyr-package mit bekannten Datensatz aus ggplot2, 'diamonds' - Daten. Ich bin versucht zu berechnen, bedeutet "Preis" des Diamanten gruppiert nach Variablen 'cut'. Mein code ist wie folgt. price.cut <- diamonds %>% group_by(cut) %>% summarize(Mean

R-data frame Rang von Gruppen (group by Rang) mit Paket dplyr

Anzahl der Antworten

3 Antworten

Habe ich einen Daten-frame 'test', die wie folgt Aussehen: session_id seller_feedback_score 1 1 282470 2 1 275258 3 1 275258 4 1 275258 5 1 37831 6 1 282470 7 1 26 8 1 138351 9 1

dataframe dplyr r rank

Die Anordnung der Zeilen in benutzerdefinierten Reihenfolge mit dplyr

Anzahl der Antworten

2 Antworten

Mit arrange Funktion in dplyr können wir arrangieren Zeile in aufsteigender oder absteigender Reihenfolge. Die Frage, wie ordnen Sie die Zeilen in benutzerdefinierten Reihenfolge. Bitte sehen MWE. Reg <- rep(LETTERS[1:3], each = 2) Res <- rep(c("Urban", "Rural"),

data-manipulation dplyr r

1
2
3
4
5
6