Tag: tidyr

tidyr ist ein R-Paket von Hadley Wickham für die Reinigung und Umformen von Daten, entwickelt, um den magrittr Rohr ( % > % ), so interagieren auch mit dplyr und ähnliche pipeable Pakete, die den Schwerpunkt auf saubere Daten. tidyr ist der Nachfolger reshape2.

Wie kann ich spread mit wiederholten Messungen von mehrere Variablen in einem breiten format?

Anzahl der Antworten 4 Antworten
Ich versuche, die Spalten, die im long-format und verbreiten wide format, wie unten dargestellt. Ich möchte die tidyr um dieses Problem zu lösen mit der Daten-manipulation-tools, die ich in investieren, aber um diese Antwort mehr allgemein bitte

R: Verbreitung-Funktion-Daten-frame mit Duplikaten

Anzahl der Antworten 1 Antworten
Habe ich einen Daten-frame, die ich brauche, um pivot-aber der Daten-frame hat doppelte IDS, so spread Funktion gibt einen Fehler Error: Duplicate identifiers for rows (5, 6) Dimension = c("A","A","B","B","A","A") Date = c("Mon","Tue","Mon","Wed","Fri","Fri") Metric = c(23,25,7,9,7,8) df

Behalten Parametern bei Verwendung sammeln von tidyr (Attribute sind nicht identisch)

Anzahl der Antworten 2 Antworten
Ich habe einen Daten-frame, der muss geteilt werden in zwei Tabellen zu befriedigen Codd 3. Normalform. In einem einfachen Fall die original-Daten-frame sieht ungefähr so aus: library(lubridate) > (df <- data.frame(hh_id = 1:2, income = c(55000, 94000),

Umgestaltung mehrerer Sätze von mess-Spalten (breit-format) in einzelne Spalten (langes format)

Anzahl der Antworten 7 Antworten
Ich habe einen dataframe in einem breiten format, mit wiederholten Messungen, die innerhalb von unterschiedlichen Zeiträumen. In meinem Beispiel gibt es drei verschiedene Zeiträume, die alle mit Ihren entsprechenden Werten. E. g. die erste Messung (Value1) gemessen

separate() in tidyr mit NA

Anzahl der Antworten 2 Antworten
Ich habe eine Frage in Bezug auf separate() im tidyr Paket. Wenn es keine NA in einen Daten-frame, separate() funktioniert. Ich habe mit dieser Funktion eine Menge. Aber, heute hatte ich einen Fall, in dem es NAs

Wie so transponieren Sie einen dataframe in tidyverse?

Anzahl der Antworten 1 Antworten
Verwendung der basic-R, ich kann transponieren Sie einen dataframe, sagen mtcars, die alle Spalten der gleichen Klasse: as.data.frame(t(mtcars)) Oder mit Rohren: library(magrittr) mtcars %>% t %>% as.data.frame Wie das zu erreichen ist die gleiche in tidyr oder

Wie verbreitet Spalten mit identischen Bezeichnern?

Anzahl der Antworten 1 Antworten
Einen haben die folgenden tibble: structure(list(age = c("21", "17", "32", "29", "15"), gender = structure(c(2L, 1L, 1L, 2L, 2L), .Label = c("Female", "Male"), class = "factor")), row.names = c(NA, -5L), class = c("tbl_df", "tbl", "data.frame"), .Names =

wie spread() in tidyr Griffe Faktor Ebenen

Anzahl der Antworten 1 Antworten
War ich Bearbeiten meine Daten und fand, dass ich etwas falsch gemacht habe irgendwann in den Prozess. Wenn erkundete ich das problem, das problem kam auf, das folgende Verhalten von spread() im tidyr Paket. Hier ist ein

Entfernen von NA-Beobachtungen mit dplyr::filter()

Anzahl der Antworten 2 Antworten
Meiner Daten sieht wie folgt aus: library(tidyverse) df <- tribble( ~a, ~b, ~c, 1, 2, 3, 1, NA, 3, NA, 2, 3 ) Kann ich entfernen Sie alle NA Beobachtungen mit drop_na(): df %>% drop_na() Oder entfernen

Erzeugen einer dummy-variable

Anzahl der Antworten 15 Antworten
Ich habe Probleme beim generieren der folgende dummy-Variablen in R: Analysiere ich jährlich Zeitreihen-Daten (Zeitraum 1948-2009). Ich habe zwei Fragen: Wie erstelle ich eine dummy-variable für Beobachtung #10, also für das Jahr 1957 (Wert = 1, 1957,

Spread mit data.frame / tibble mit doppelten Bezeichnern

Anzahl der Antworten 1 Antworten
In der Dokumentation für tidyr deutet darauf hin, dass sammeln und verbreiten transitiv, aber das folgende Beispiel mit der "iris" - Daten zeigt, sind Sie nicht, aber es ist nicht klar, warum. Klärung wäre sehr dankbar iris.df

Verwenden von dplyr-Fensterfunktionen zum Berechnen von Perzentilen

Anzahl der Antworten 6 Antworten
Ich habe eine funktionierende Lösung, bin aber auf der Suche für eine sauberere, besser lesbaren Lösung, vielleicht nutzt einige der neueren dplyr-Fenster-Funktionen. Über die mtcars Datensatz, wenn ich will, zu betrachten, die 25 -, 50 -, 75-Perzentile

dplyr fazit: Äquivalent von ".drop = FALSE", um Gruppen mit der Länge Null in der Ausgabe zu behalten

Anzahl der Antworten 3 Antworten
Bei der Verwendung summarise mit plyr's ddply Funktion, leere Kategorien werden gelöscht, durch Voreinstellung. Sie können dieses Verhalten ändern, durch hinzufügen von .drop = FALSE. Dies bedeutet jedoch nicht, die Arbeit, wenn Sie summarise mit dplyr. Ist

Vergleiche sammeln (tidyr) zu schmelzen (reshape2)

Anzahl der Antworten 1 Antworten
Ich Liebe die reshape2 Paket, weil es das Leben so doggone einfach. In der Regel Hadley hat Verbesserungen in seinem vorherigen Pakete, die es ermöglichen, optimierte, schnellere ausführen von code. Ich dachte, ich würde geben tidyr einen

Ist es möglich, Spread auf mehrere Spalten in tidyr ähnlich wie bei dcast zu verwenden?

Anzahl der Antworten 1 Antworten
Habe ich folgenden dummy-Daten: library(dplyr) library(tidyr) library(reshape2) dt <- expand.grid(Year = 1990:2014, Product=LETTERS[1:8], Country = paste0(LETTERS, "I")) %>% select(Product, Country, Year) dt$value <- rnorm(nrow(dt)) Nehme ich zwei-Produkt-Länder-Kombinationen sdt <- dt %>% filter((Product == "A" & Country ==

Spread mit doppelten Bezeichnern für Zeilen verwenden

Anzahl der Antworten 3 Antworten
Habe ich eine lange form dataframe, die mehrere Einträge für das gleiche Datum und person. jj <- data.frame(month=rep(1:3,4), student=rep(c("Amy", "Bob"), each=6), A=c(9, 7, 6, 8, 6, 9, 3, 2, 1, 5, 6, 5), B=c(6, 7, 8, 5,