Tag: dplyr

Verwenden Sie dieses tag für Fragen in Bezug auf Funktionen aus dem Paket dplyr, wie group_by, zusammenfassen, filtern und auswählen.

Dplyr - Filter, wenn eine variable gleich einen Wert

Anzahl der Antworten 5 Antworten
Ich habe einen Datensatz a mit 5 Variablen und filtern wollen es so: a1 <- a %>% filter(var_1 != 1 , var_2 != 1 , var_3 != 1 , var_4 != 1 , variable_5 != 1) Ich

gruppierte Operationen, die Ergebnis von der Länge nicht gleich um 1 oder die Länge der Gruppe in dplyr

Anzahl der Antworten 2 Antworten
Ich bin mir nicht sicher, welche Funktion verwenden, um Folgendes zu tun: library(data.table) dt = data.table(a = 1:4, b = 1:2) dt[, rep(a[1], 3), by = b] # b V1 #1: 1 1 #2: 1 1 #3:

Fehler in den Daten.Rahmen , unbenutzt argument

Anzahl der Antworten 1 Antworten
Habe ich in diesem dataframe : > head(merged.tables) Store DayOfWeek Date Sales Customers Open Promo StateHoliday SchoolHoliday StoreType 1 1 5 2015-07-31 5263 555 1 1 0 1 c 2 1 6 2013-01-12 4952 646 1 0

Mit dplyr zu erzeugen Zusammenfassung Teil Tabelle mit mehreren kategorischen/Faktor Variablen

Anzahl der Antworten 2 Antworten
Ich versuche zum erstellen einer Tabelle zusammengefasst werden mehrere kategoriale Variablen (mit Frequenzen und Proportionen), die von anderen Variablen. Ich möchte dies tun, indem Sie das dplyr-package. Diese vorherigen Stack-Überlauf Diskussionen haben teilweise das, was ich Suche:

alle.gleich auf Objekt mit NULL-Namen, die Ursachen "Fehler: nicht kompatibel mit STRSXP' — bug oder erwartet?

Anzahl der Antworten 1 Antworten
In dem Beispiel unten, wenn die Namen gesetzt werden, um NULL, all.equal wirft 'Error: not compatible with STRSXP' Allerdings sind die Namen gesetzt, um NA (oder einen anderen Wert), all.equal funktioniert ganz normal. Ist das erwartete Verhalten,

dplyr::mutieren (zuweisen na.rm =TRUE)

Anzahl der Antworten 3 Antworten
Ich habe einen Daten.Rahmen, 100 Variablen. Ich möchte die Summe der drei Variablen nur mit mutate (nicht summarise). Wenn es NA in einem der 3 Variablen, die ich immer noch wollen, um die sum. Um dies zu

Zusammenfassung der Werte in dplyr - Abstürze RStudio

Anzahl der Antworten 1 Antworten
Kann dplyr durchführen angekettet summarise Operationen auf einem data.frame? Meine Daten.Rahmen hat die Struktur: data_df = tbl_df(data) data_df %.% group_by(col_1) %.% summarise(number_of= length(col_2)) %.% summarise(sum_of = sum(col_3)) Diese Ursachen RStudio begegnen fatal error - R Session Aborted

Wie wird man aufhören, rowwise in dplyr?

Anzahl der Antworten 2 Antworten
So, wenn man wünscht, um eine operation zeilenweise in dplyr, man kann die rowwise Funktion, zum Beispiel: Anwenden einer Funktion auf alle Zeilen einer Tabelle mit dplyr? Gibt es eine unrowwise Funktion, die Sie verwenden können, um

Die Berechnung der Differenz zwischen zwei aufeinander folgenden Zeilen, indem Sie die Gruppe mit dplyr?

Anzahl der Antworten 2 Antworten
Habe ich ein dataframe von ids und Zeitstempel. Ich würde gerne berechnen den Unterschied zwischen den einzelnen sequentiellen timestamp für eine individuelle id. Mein dataframe sieht wie folgt aus: id time Alpha 1 Alpha 4 Alpha 7

R: row-wise dplyr::mutieren mit Funktion, der einen Daten-frame Reihe und gibt eine Ganzzahl zurück

Anzahl der Antworten 2 Antworten
Ich versuche, mit Rohr mutieren-Anweisung mit einer benutzerdefinierten Funktion. Ich sah diesem wenig ähnlich SO ein post aber vergeblich. Sagen, ich habe einen Daten-frame wie folgt aus (wobei blob ist einige variable, die nicht mit der spezifischen

Verwenden purrr::map-Anwendung mehrere Argumente an eine Funktion

Anzahl der Antworten 2 Antworten
Habe ich einen Daten-frame, wie dies df <- data.frame(tiny = rep(letters[1:3], 20), block = rnorm(60), tray = runif(60, min=0.4, max=2), indent = sample(0.5:2.0, 60, replace = TRUE)) Ich diese verschachtelten Daten-frame nm <- df%>% group_by(tiny)%>% nest() schrieb

Versuchen mit dplyr zu group_by und anwenden scale()

Anzahl der Antworten 2 Antworten
Versuchen, zu verwenden dplyr zu group_by die stud_ID variable in der folgenden Daten-frame, wie in diese Frage ALSO: > str(df) 'data.frame': 4136 obs. of 4 variables: $ stud_ID : chr "ABB112292" "ABB112292" "ABB112292" "ABB112292" ... $ behavioral_scale:

filter und unfilter in dplyr

Anzahl der Antworten 2 Antworten
Was wäre das dplyr analog zur Durchführung der folgenden operation in Basis-f? iris$Sepal.Length[iris$Sepal.Length>2] <- iris$Sepal.Length[iris$Sepal.Length>2] * 10 Ich versuche, mit filter, aber nicht zurück, um zu den ursprünglichen Daten-set (ohne join) mutate mit ifelse z.B. iris %>%

Anwenden eines ggplot-Funktion pro Gruppe mit dplyr und Titel festlegen pro Gruppe

Anzahl der Antworten 3 Antworten
Ich würde gerne erstellen Sie einen separaten plot pro Gruppe in einem Daten-frame und nehmen Sie die Gruppe in die Titel. Mit den iris-Datensatz kann ich in base-R und ggplot dies plots1 <- lapply(split(iris, iris$Species), function(x) ggplot(x,

Mit zusammenfassen mit gewogenen Mittelwert von dplyr in R

Anzahl der Antworten 2 Antworten
Ich versuche, ordentlich ein dataset, mit dplyr. Meine Variablen enthalten, die Prozentsätze und einfache Werte (in diesem Fall, Seitenaufrufe und Absprungrate). Ich habe versucht, zu fassen Sie folgendermaßen zusammen: require(dplyr) df<-df%>% group_by(pagename)%>% summarise(pageviews=sum(pageviews), bounceRate= weighted.mean(bounceRate,pageviews)) Aber dies

Wie kann dplyr generieren von Daten-Frames für jede Gruppe nach der group_by-Betrieb?

Anzahl der Antworten 2 Antworten
War ich sehr schockiert von der Glätte des dplyr-package im flow-style-Daten-Verarbeitung. Vor kurzem habe ich in Eile ein problem erzeugen Sie einen neuen data frame für jede Gruppen-ID und kombinieren Sie diese kleinen Daten-frames zu einer letzten

Wie diese zu interpretieren Fehlermeldung: (list) Objekt kann nicht sein, gezwungen zu Typ 'double'

Anzahl der Antworten 1 Antworten
Ich habe eine Tabelle: numTable, die wie folgt aussieht: Nun will ich finden outiers für jede dieser Spalten. Bitte Lesen Sie meine folgenden code: for (i in names(numTable)) { #calculate mean and std for each column meanValue

R Fehler: erwartet einen einzelnen Wert, was bedeutet es?

Anzahl der Antworten 1 Antworten
Ich bin dabei eine einfache Bedienung mit dplyr in R und hab 'erwartet einzelner Wert' Fehler test <- data.frame(a=rep("item",3),b=c("step1","step2","step3")) test%>%group_by(a)%>%(summarize(seq=paste0(b)) Ich habe gesehen, ähnliche threads, aber diese use cases wurden immer komplexer, und ich konnte nicht herausfinden,

eindeutige Zeilen in dplyr : row_number() von tbl_dt inkonsistent, tbl_df

Anzahl der Antworten 2 Antworten
en bref: Frage ich mich, wie man einzigartige Zeilen aus einer data.table im irgendwo entlang einer dplyr workflow. Seit v0.2, die ich verwenden kann row_number==1 (finden Sie unter: Entfernen Sie doppelte Zeilen mit dplyr) ABER! tbl_df(data) %>%

R: Verbreitung-Funktion-Daten-frame mit Duplikaten

Anzahl der Antworten 1 Antworten
Habe ich einen Daten-frame, die ich brauche, um pivot-aber der Daten-frame hat doppelte IDS, so spread Funktion gibt einen Fehler Error: Duplicate identifiers for rows (5, 6) Dimension = c("A","A","B","B","A","A") Date = c("Mon","Tue","Mon","Wed","Fri","Fri") Metric = c(23,25,7,9,7,8) df

Fehler in UseMethod("select_")

Anzahl der Antworten 1 Antworten
Lange Zeit lurker, erste mal poster. Ich bin in einer Einführungs-R-Kurs und ich bin versucht zu erstellen Histogramme und Zusammenfassungen für das Alter der Diagnose mit diabetes "diabage2" und Ihre insulin verwenden, "insulin" (ja/Nein/KA). Das dataset ist

R Dplyr mutieren, ist die Berechnung der Standardabweichung für jede Zeile

Anzahl der Antworten 4 Antworten
Ich versuche zu berechnen, den Mittelwert und die Standardabweichung von bestimmten Spalten in einem data frame, und kehren Sie diese Werte für neue Spalten in der Daten-frame. Ich kann diese arbeiten für meine: library(dplyr) mtcars = mutate(mtcars,

Bedingte Ersetzung der Spalte name in tibble mit dplyr

Anzahl der Antworten 5 Antworten
Habe ich Folgendes tibble: df <- structure(list(gene_symbol = c("0610005C13Rik", "0610007P14Rik", "0610009B22Rik", "0610009L18Rik", "0610009O20Rik", "0610010B08Rik" ), foo.control.cv = c(1.16204038288333, 0.120508045270669, 0.205712615954009, 0.504508040948641, 0.333956330117591, 0.543693011377001), foo.control.mean = c(2.66407458486012, 187.137728870855, 142.111269303428, 16.7278587043453, 69.8602872478098, 4.77769028710622), foo.treated.cv = c(0.905769898934564, 0.186441944401973, 0.158552512842753, 0.551955061149896,

Anzahl der Zeilen des Ergebnis nicht ein Vielfaches von Vektor-Länge (arg 2) in R

Anzahl der Antworten 1 Antworten
Habe ich neue Frage im Zusammenhang mit diesem meinem Thema löschen Ausreißer in r mit Berücksichtigung der Nenn-var. In neuen Fall-Variablen x und x1 unterschiedliche Länge x <- c(-10, 1:6, 50) x1<- c(-20, 1:5, 60) z<- c(1,2,3,4,5,6,7,8)

Probleme mit bind_rows() von dplyr - package laden-Fehler?

Anzahl der Antworten 2 Antworten
Ich versuche, die bind_rows () - Funktion von dplyr (Version 0.4.1), aber R-Befehl Linie kann nicht die Funktion. Es kann finden Sie in der Hilfe der Funktion, aber alle Bemühungen um die Funktion zu verwenden sind erfüllt

Zuweisen von Terminen zum Geschäftsjahr

Anzahl der Antworten 4 Antworten
Ich versuche zu kommen mit einigen code, der Blick auf ein Datum, und dann weisen Sie es einem Geschäftsjahr. Ich bin völlig stecken. Ich habe eine variable, die Datumsangaben enthält, im POSIXct-format: df$Date #2015-05-01 CST #2015-04-30 CST

Bedingt auswählen von Spalten in dplyr, wo bestimmter Anteil der Werte ist NA

Anzahl der Antworten 3 Antworten
Daten Ich arbeite mit einem Datensatz, die wie die data.frame darunter generiert: set.seed(1) dta <- data.frame(observation = 1:20, valueA = runif(n = 20), valueB = runif(n = 20), valueC = runif(n = 20), valueD = runif(n =

Was bedeutet n=n( ) bedeutet R?

Anzahl der Antworten 1 Antworten
Den anderen Tag Las ich die folgenden Zeilen in R, und ich verstehe nicht, was der %>% und summarise(n=n()) und summarise(total=n()) gemeint. Ich verstehe die group_by und ungroup Methoden aber. Kann jemand helfen? Es gibt keine Dokumentation

dplyr-package: Wie kann ich die Abfrage von großen Daten-frame mit like '%xyz%' SQL-syntax?

Anzahl der Antworten 2 Antworten
dplyr ist das einzige Paket, das verarbeiten kann, meine 843k Daten.Rahmen und Abfragen in einer schnellen Weise. Ich kann filter fein mit etwas Mathe und gleiche Kriterien, aber ich brauche eine Suchfunktion zu implementieren, für ein Konzept.

Wie kann ich die variable(Spalte) die Namen Rstudio?

Anzahl der Antworten 2 Antworten
Wie kann ich die variable(Spalte) die Namen Rstudio? Ich könnte nicht es tun mit plyr package oder eine andere Daten-manipulation-R-Paket. Geben minimale reproduzierbare Beispiel. Schließlich verwenden names(df)[..] <- "newname" Aber dies bezieht sich auf R und nicht

Berechnen Prozentuale Veränderung in R mit dplyr

Anzahl der Antworten 2 Antworten
Möchte ich ermitteln, welcher Prozentsatz des Profit durch YEAR das ist eine ziemlich einfache Aufgabe, aber irgendwie bin ich immer NA. Ich habe dieselben Fragen gestellt, bevor, aber ich bin nicht in der Lage zu verstehen, warum

So wählen Sie alle Spalten in dplyr/sql?

Anzahl der Antworten 1 Antworten
Ich bin die Verbindung einer MySQL Datenbank mit dplyr und verarbeiten die Daten mit dplyr und die %>% operatot anschließend. conDplyr <- src_mysql(user = db_user, password = db_pw, dbname = db_name, host = db_host, port = some_port)

dplyr mutieren rowwise max Reichweite von Spalten

Anzahl der Antworten 4 Antworten
Kann ich mit dem folgenden zurückzukehren, die maximal 2 Spalten newiris<-iris %>% rowwise() %>% mutate(mak=max(Sepal.Width,Petal.Length)) Was ich tun möchte, ist zu finden, dass sich maximal über einen Bereich von Spalten, so habe ich nicht den Namen jeder

Wie kann ich berechnen Sie die prozentuale Veränderung innerhalb einer Gruppe für mehrere Spalten in R?

Anzahl der Antworten 2 Antworten
Habe ich einen Daten-frame mit einer ID-Spalte, eine Spalte Datum (12 Monate für jede ID), und ich habe 23 numerische Variablen. Ich würde gerne erhalten die prozentuale Veränderung von Monat innerhalb der jeweiligen ID. Ich bin mit

group by und filtern von Daten-management mit dplyr

Anzahl der Antworten 2 Antworten
Nehmen wir ein einfaches dataset a <- c(1,2,3,4,5,6,7,8) b <- c(1,2,2,1,2,2,2,2) c <- c(1,1,1,2,2,2,3,3) d <- data.frame(a,b,c) nun will ich meine filter Daten, so dass wir group_by(c) und entfernen Sie dann alle Daten, bei denen keine b=1Auftritt.

Dplyr beitreten auf durch=(a = b), wo a und b sind Variablen mit strings?

Anzahl der Antworten 4 Antworten
Ich versuche, führen Sie eine inner join zwei Tabellen mit dplyr, und ich glaube, ich bin immer ausgelöst durch nicht-standard-Bewertung Regeln. Bei der Verwendung der durch=("a" = "b") - argument, funktioniert alles wie erwartet, wenn "a" und

Kategorisieren numerische variable mit mutieren

Anzahl der Antworten 2 Antworten
Ich würde gerne eine Kategorisierung numerische variable in meinem data.frame Objekt mit der Verwendung von dplyr (und habe keine Ahnung, wie es zu tun). Ohne dplyr würde, würde ich wahrscheinlich etwas wie: df <- data.frame(a = rnorm(1e3),

group by und Skalierung/Normierung einer Spalte in r

Anzahl der Antworten 2 Antworten
Ich habe einen dataframe, der wie folgt aussieht: Store Temperature Unemployment Sum_Sales 1 1 42.31 8.106 1643691 2 1 38.51 8.106 1641957 3 1 39.93 8.106 1611968 4 1 46.63 8.106 1409728 5 1 46.50 8.106 1554807

Summen-Zeilen, indem Sie Monat für Monat in R

Anzahl der Antworten 4 Antworten
Also ich habe einen Daten-frame, der hat eine Spalte Datum, eine Stunde, Spalte und eine Reihe von anderen numerischen Spalten. Jede Zeile in der Daten-frame ist 1 Stunde 1 Tag für ein ganzes Jahr. Den Daten-frame sieht

Filter mehrere Werte für eine string-Spalte in dplyr

Anzahl der Antworten 3 Antworten
Ich habe eine data.frame mit Charakter Daten in einer der Spalten. Ich würde gerne mehrere filter-Optionen in der data.frame aus der gleichen Spalte. Gibt es einen einfachen Weg, dies zu tun, dass ich bin fehlt? Beispiel: data.frame

Vereinbaren Sie einen grouped_df Gruppe von Variablen funktioniert nicht

Anzahl der Antworten 2 Antworten
Ich habe einen Daten.frame, client-Namen, Jahren, und einige Umsatz-zahlen aus jedem Jahr. df <- data.frame(client = rep(c("Client A","Client B", "Client C"),3), year = rep(c(2014,2013,2012), each=3), rev = rep(c(10,20,30),3) ) Möchte ich am Ende mit einem Daten.Rahmen, die

filter-Funktion in dplyr Fehler

Anzahl der Antworten 4 Antworten
Habe ich einen Daten-frame in R wie sogenannte UK_profiles: row.names id name 1 1 8131437 Profile 2 2 8131719 WolverineCompetition 3 4 8132011 www.vaseline.com 4 10 23265829 www.keepingskinamazing.co.uk 5 23 8042743 Mobile 6 24 8043312 Test 7

Rang variable Gruppe (dplyr)

Anzahl der Antworten 2 Antworten
Ich habe einen dataframe mit den Spalten x1, x2, group und ich möchte, um ein neues dataframe mit einer extra Spalte rank zeigt, dass die Reihenfolge der x1 in seiner Gruppe. Es ist eine Frage im Zusammenhang

dplyr mutieren mit bedingter Werte

Anzahl der Antworten 3 Antworten
In einem großen dataframe ("myfile") mit vier Spalten, die ich haben, um eine fünfte Spalte mit Werten bedingt auf die ersten vier Spalten. Lieber Antworten mit dplyr und mutate vor allem wegen seiner Geschwindigkeit in großen Datenmengen.

Mit als.numerische, mit Funktionen und-Rohre in R

Anzahl der Antworten 1 Antworten
Ich habe eine Funktion, die wie folgt aussieht calc_df <- function(A_df, B_df){ C_df <- filter(A_df, Type == "Animal") %>% left_join(B_df) %>% as.numeric(C$Count) Wo ich nicht den letzten Kalk zu arbeiten, die ersten 3 funktionieren einwandfrei, aber ich

Pass ein Vektor von Variablen-Namen zu organisieren() in dplyr

Anzahl der Antworten 4 Antworten
Möchte ich weitergeben arrange() {dplyr} ein Vektor von Variablen-Namen zu Sortieren. In der Regel, die ich geben Sie nur die Variablen, die ich will, aber ich bin versucht zu machen, eine Funktion, bei der Sortierung von Variablen

Gibt es eine alternative zu "ordnen" - Funktion von plyr bei der Verwendung von dplyr?

Anzahl der Antworten 4 Antworten
Ich bin ein fan der revalue Funktion ist plyr für die Ersetzung von Zeichenfolgen. Es ist einfach und leicht zu merken. Allerdings habe ich migriert neuen code zu dplyr die scheint nicht zu haben eine revalue Funktion.

Wird cut () - Stil-binning erhältlich in dplyr?

Anzahl der Antworten 1 Antworten
Gibt es eine Möglichkeit, etwas zu tun, wie ein cut() Funktion binning für numerische Werte in einer dplyr Tabelle? Ich arbeite an einer großen postgres-Tabelle und kann derzeit entweder schreiben Sie eine case-Anweisung in der sql-am Anfang

dplyr mutieren/ersetzen, mehrere Spalten auf eine Teilmenge der Zeilen

Anzahl der Antworten 12 Antworten
Ich bin in den Prozess zu versuchen, eine dplyr-basierten workflow (anstatt vor allem Daten.Tabelle, die ich gewohnt bin), und ich habe auf ein problem stoßen, dass ich nicht finden können, ein gleichwertiges dplyr-Lösung an. Ich Häufig laufen

R, dplyr - Kombination von group_by() und anordnen() nicht zu den erwarteten Ergebnis?

Anzahl der Antworten 3 Antworten
wenn mit dplyr-Funktion group_by() und sofort danach arrange(), würde ich erwarten, dass man eine Ausgabe, bei der Daten-frame ist bestellt innerhalb Gruppen, erklärte ich in group_by(). Mein Lesen der Dokumentation ist, dass diese Kombination sollte zu einem