Tag: tidyr
tidyr ist ein R-Paket von Hadley Wickham für die Reinigung und Umformen von Daten, entwickelt, um den magrittr Rohr ( % > % ), so interagieren auch mit dplyr und ähnliche pipeable Pakete, die den Schwerpunkt auf saubere Daten. tidyr ist der Nachfolger reshape2.
4
Antworten
Ich versuche, die Spalten, die im long-format und verbreiten wide format, wie unten dargestellt. Ich möchte die tidyr um dieses Problem zu lösen mit der Daten-manipulation-tools, die ich in investieren, aber um diese Antwort mehr allgemein bitte
1
Antworten
Habe ich einen Daten-frame, die ich brauche, um pivot-aber der Daten-frame hat doppelte IDS, so spread Funktion gibt einen Fehler Error: Duplicate identifiers for rows (5, 6) Dimension = c("A","A","B","B","A","A") Date = c("Mon","Tue","Mon","Wed","Fri","Fri") Metric = c(23,25,7,9,7,8) df
2
Antworten
Ich habe einen Daten-frame, der muss geteilt werden in zwei Tabellen zu befriedigen Codd 3. Normalform. In einem einfachen Fall die original-Daten-frame sieht ungefähr so aus: library(lubridate) > (df <- data.frame(hh_id = 1:2, income = c(55000, 94000),
7
Antworten
Ich habe einen dataframe in einem breiten format, mit wiederholten Messungen, die innerhalb von unterschiedlichen Zeiträumen. In meinem Beispiel gibt es drei verschiedene Zeiträume, die alle mit Ihren entsprechenden Werten. E. g. die erste Messung (Value1) gemessen
2
Antworten
Ich habe eine Frage in Bezug auf separate() im tidyr Paket. Wenn es keine NA in einen Daten-frame, separate() funktioniert. Ich habe mit dieser Funktion eine Menge. Aber, heute hatte ich einen Fall, in dem es NAs
1
Antworten
Verwendung der basic-R, ich kann transponieren Sie einen dataframe, sagen mtcars, die alle Spalten der gleichen Klasse: as.data.frame(t(mtcars)) Oder mit Rohren: library(magrittr) mtcars %>% t %>% as.data.frame Wie das zu erreichen ist die gleiche in tidyr oder
1
Antworten
Einen haben die folgenden tibble: structure(list(age = c("21", "17", "32", "29", "15"), gender = structure(c(2L, 1L, 1L, 2L, 2L), .Label = c("Female", "Male"), class = "factor")), row.names = c(NA, -5L), class = c("tbl_df", "tbl", "data.frame"), .Names =
1
Antworten
War ich Bearbeiten meine Daten und fand, dass ich etwas falsch gemacht habe irgendwann in den Prozess. Wenn erkundete ich das problem, das problem kam auf, das folgende Verhalten von spread() im tidyr Paket. Hier ist ein
2
Antworten
Meiner Daten sieht wie folgt aus: library(tidyverse) df <- tribble( ~a, ~b, ~c, 1, 2, 3, 1, NA, 3, NA, 2, 3 ) Kann ich entfernen Sie alle NA Beobachtungen mit drop_na(): df %>% drop_na() Oder entfernen
15
Antworten
Ich habe Probleme beim generieren der folgende dummy-Variablen in R: Analysiere ich jährlich Zeitreihen-Daten (Zeitraum 1948-2009). Ich habe zwei Fragen: Wie erstelle ich eine dummy-variable für Beobachtung #10, also für das Jahr 1957 (Wert = 1, 1957,
1
Antworten
In der Dokumentation für tidyr deutet darauf hin, dass sammeln und verbreiten transitiv, aber das folgende Beispiel mit der "iris" - Daten zeigt, sind Sie nicht, aber es ist nicht klar, warum. Klärung wäre sehr dankbar iris.df
6
Antworten
Ich habe eine funktionierende Lösung, bin aber auf der Suche für eine sauberere, besser lesbaren Lösung, vielleicht nutzt einige der neueren dplyr-Fenster-Funktionen. Über die mtcars Datensatz, wenn ich will, zu betrachten, die 25 -, 50 -, 75-Perzentile
3
Antworten
Bei der Verwendung summarise mit plyr's ddply Funktion, leere Kategorien werden gelöscht, durch Voreinstellung. Sie können dieses Verhalten ändern, durch hinzufügen von .drop = FALSE. Dies bedeutet jedoch nicht, die Arbeit, wenn Sie summarise mit dplyr. Ist
1
Antworten
Ich Liebe die reshape2 Paket, weil es das Leben so doggone einfach. In der Regel Hadley hat Verbesserungen in seinem vorherigen Pakete, die es ermöglichen, optimierte, schnellere ausführen von code. Ich dachte, ich würde geben tidyr einen
1
Antworten
Habe ich folgenden dummy-Daten: library(dplyr) library(tidyr) library(reshape2) dt <- expand.grid(Year = 1990:2014, Product=LETTERS[1:8], Country = paste0(LETTERS, "I")) %>% select(Product, Country, Year) dt$value <- rnorm(nrow(dt)) Nehme ich zwei-Produkt-Länder-Kombinationen sdt <- dt %>% filter((Product == "A" & Country ==
3
Antworten
Habe ich eine lange form dataframe, die mehrere Einträge für das gleiche Datum und person. jj <- data.frame(month=rep(1:3,4), student=rep(c("Amy", "Bob"), each=6), A=c(9, 7, 6, 8, 6, 9, 3, 2, 1, 5, 6, 5), B=c(6, 7, 8, 5,