Tag: tidyr

tidyr ist ein R-Paket von Hadley Wickham für die Reinigung und Umformen von Daten, entwickelt, um den magrittr Rohr ( % > % ), so interagieren auch mit dplyr und ähnliche pipeable Pakete, die den Schwerpunkt auf saubere Daten. tidyr ist der Nachfolger reshape2.

Wie kann ich spread mit wiederholten Messungen von mehrere Variablen in einem breiten format?

4 Antworten

Ich versuche, die Spalten, die im long-format und verbreiten wide format, wie unten dargestellt. Ich möchte die tidyr um dieses Problem zu lösen mit der Daten-manipulation-tools, die ich in investieren, aber um diese Antwort mehr allgemein bitte

r tidyr

R: Verbreitung-Funktion-Daten-frame mit Duplikaten

1 Antworten

Habe ich einen Daten-frame, die ich brauche, um pivot-aber der Daten-frame hat doppelte IDS, so spread Funktion gibt einen Fehler Error: Duplicate identifiers for rows (5, 6) Dimension = c("A","A","B","B","A","A") Date = c("Mon","Tue","Mon","Wed","Fri","Fri") Metric = c(23,25,7,9,7,8) df

Behalten Parametern bei Verwendung sammeln von tidyr (Attribute sind nicht identisch)

2 Antworten

Ich habe einen Daten-frame, der muss geteilt werden in zwei Tabellen zu befriedigen Codd 3. Normalform. In einem einfachen Fall die original-Daten-frame sieht ungefähr so aus: library(lubridate) > (df <- data.frame(hh_id = 1:2, income = c(55000, 94000),

r tidyr

Umgestaltung mehrerer Sätze von mess-Spalten (breit-format) in einzelne Spalten (langes format)

7 Antworten

Ich habe einen dataframe in einem breiten format, mit wiederholten Messungen, die innerhalb von unterschiedlichen Zeiträumen. In meinem Beispiel gibt es drei verschiedene Zeiträume, die alle mit Ihren entsprechenden Werten. E. g. die erste Messung (Value1) gemessen

r r-faq reshape reshape2 tidyr

separate() in tidyr mit NA

2 Antworten

Ich habe eine Frage in Bezug auf separate() im tidyr Paket. Wenn es keine NA in einen Daten-frame, separate() funktioniert. Ich habe mit dieser Funktion eine Menge. Aber, heute hatte ich einen Fall, in dem es NAs

r tidyr

Wie so transponieren Sie einen dataframe in tidyverse?

1 Antworten

Verwendung der basic-R, ich kann transponieren Sie einen dataframe, sagen mtcars, die alle Spalten der gleichen Klasse: as.data.frame(t(mtcars)) Oder mit Rohren: library(magrittr) mtcars %>% t %>% as.data.frame Wie das zu erreichen ist die gleiche in tidyr oder

dataframe r tidyr tidyverse transpose

Wie verbreitet Spalten mit identischen Bezeichnern?

1 Antworten

Einen haben die folgenden tibble: structure(list(age = c("21", "17", "32", "29", "15"), gender = structure(c(2L, 1L, 1L, 2L, 2L), .Label = c("Female", "Male"), class = "factor")), row.names = c(NA, -5L), class = c("tbl_df", "tbl", "data.frame"), .Names =

r tidyr

wie spread() in tidyr Griffe Faktor Ebenen

1 Antworten

War ich Bearbeiten meine Daten und fand, dass ich etwas falsch gemacht habe irgendwann in den Prozess. Wenn erkundete ich das problem, das problem kam auf, das folgende Verhalten von spread() im tidyr Paket. Hier ist ein

r spread tidyr

Entfernen von NA-Beobachtungen mit dplyr::filter()

2 Antworten

Meiner Daten sieht wie folgt aus: library(tidyverse) df <- tribble( ~a, ~b, ~c, 1, 2, 3, 1, NA, 3, NA, 2, 3 ) Kann ich entfernen Sie alle NA Beobachtungen mit drop_na(): df %>% drop_na() Oder entfernen

dplyr r tidyr tidyverse

Erzeugen einer dummy-variable

15 Antworten

Ich habe Probleme beim generieren der folgende dummy-Variablen in R: Analysiere ich jährlich Zeitreihen-Daten (Zeitraum 1948-2009). Ich habe zwei Fragen: Wie erstelle ich eine dummy-variable für Beobachtung #10, also für das Jahr 1957 (Wert = 1, 1957,

data.table dplyr r r-faq reshape2 tidyr

Spread mit data.frame / tibble mit doppelten Bezeichnern

1 Antworten

In der Dokumentation für tidyr deutet darauf hin, dass sammeln und verbreiten transitiv, aber das folgende Beispiel mit der "iris" - Daten zeigt, sind Sie nicht, aber es ist nicht klar, warum. Klärung wäre sehr dankbar iris.df

r tidyr

Verwenden von dplyr-Fensterfunktionen zum Berechnen von Perzentilen

6 Antworten

Ich habe eine funktionierende Lösung, bin aber auf der Suche für eine sauberere, besser lesbaren Lösung, vielleicht nutzt einige der neueren dplyr-Fenster-Funktionen. Über die mtcars Datensatz, wenn ich will, zu betrachten, die 25 -, 50 -, 75-Perzentile

dplyr r tidyr

dplyr fazit: Äquivalent von ".drop = FALSE", um Gruppen mit der Länge Null in der Ausgabe zu behalten

3 Antworten

Bei der Verwendung summarise mit plyr's ddply Funktion, leere Kategorien werden gelöscht, durch Voreinstellung. Sie können dieses Verhalten ändern, durch hinzufügen von .drop = FALSE. Dies bedeutet jedoch nicht, die Arbeit, wenn Sie summarise mit dplyr. Ist

dplyr plyr r tidyr

Vergleiche sammeln (tidyr) zu schmelzen (reshape2)

1 Antworten

Ich Liebe die reshape2 Paket, weil es das Leben so doggone einfach. In der Regel Hadley hat Verbesserungen in seinem vorherigen Pakete, die es ermöglichen, optimierte, schnellere ausführen von code. Ich dachte, ich würde geben tidyr einen

r reshape2 tidyr

Ist es möglich, Spread auf mehrere Spalten in tidyr ähnlich wie bei dcast zu verwenden?

1 Antworten

Habe ich folgenden dummy-Daten: library(dplyr) library(tidyr) library(reshape2) dt <- expand.grid(Year = 1990:2014, Product=LETTERS[1:8], Country = paste0(LETTERS, "I")) %>% select(Product, Country, Year) dt$value <- rnorm(nrow(dt)) Nehme ich zwei-Produkt-Länder-Kombinationen sdt <- dt %>% filter((Product == "A" & Country ==

r reshape2 tidyr

Spread mit doppelten Bezeichnern für Zeilen verwenden

3 Antworten

Habe ich eine lange form dataframe, die mehrere Einträge für das gleiche Datum und person. jj <- data.frame(month=rep(1:3,4), student=rep(c("Amy", "Bob"), each=6), A=c(9, 7, 6, 8, 6, 9, 3, 2, 1, 5, 6, 5), B=c(6, 7, 8, 5,

dplyr r tidyr