Zusammenfassung der Werte in dplyr - Abstürze RStudio
Kann dplyr
durchführen angekettet summarise
Operationen auf einem data.frame
?
Meine Daten.Rahmen hat die Struktur:
data_df = tbl_df(data)
data_df %.%
group_by(col_1) %.%
summarise(number_of= length(col_2)) %.%
summarise(sum_of = sum(col_3))
Diese Ursachen RStudio begegnen fatal error - R Session Aborted
Nachricht
In der Regel mit plyr
ich würde diese summarise
Funktionen ohne Probleme.
UPDATE
Daten sind hier.
Code:
library(dplyr)
orth <- read.csv('orth0106.csv')
orth_df = tbl_df(orth)
orth_df %.%
group_by(Hospital) %.%
summarise(Procs = length(Procedure)) %.%
summarise(SSIs = sum(SSI))
- Könnten Sie ein reproduzierbares Beispiel, um den Fehler zu reproduzieren?
- Daten und code nun enthalten.
- In Zukunft bitte die Datei, um Fehler wie diese direkt bei github. Ich habe gewählt, um zu schließen dieses Thema, da es nicht mehr gelten, sobald die nächste version von dplyr kommt (was bald sein wird)
- Diese Frage scheint off-topic, weil es einen bug-report wurde behoben, die die Entwickler-version der software.
Du musst angemeldet sein, um einen Kommentar abzugeben.
Ich den Fehler reproduzieren kann, auf die Windows 7 Maschine läuft RStudio 0.97.551
Kann es sein, weil Sie hier aufrufen
summarise
und Verkettung auf etwas, das nicht da ist. Sie könnensummarise
mit 2 verschiedenen Spalten, wie ich hier getan haben.In jedem Fall scheint dies entweder ein RStudio oder eine
dplyr
bug. Ich würde öffnen Sie ein Problem mit der Hadley-da er wohl kümmert sich so oder so. https://github.com/hadley/dplyr/issuesBEARBEITEN Diesem (Ihrem ersten Anruf) auch dazu führen, rgui (windows) und das terminal als auch zum Absturz auf:
Dies deutet auf eine
dplyr
problem Hadley und Romain wird wissen wollen.Meinen ersten Punkt, die wir führen:
Wo ist
%.% summarise(SSIs = sum(SSI))
sollSSI
?Also die Verkettung, die Sie denken, ist passiert, schlägt fehl. NACH meinem Verständnis
%.%
nicht genau wie manggplot2
funktioniert aber ähnlich. Inggplot2
sobald Sie übergeben die Daten in die ursprüngliche Zuordnung können Sie für späteren Zugriff. Hier %.% scheint sich zu ändern, greifen Sie das linke Stück und arbeiten es so:Du bist also der grabbing:
wenn Sie
%.% summarise(SSIs = sum(SSI))
und es gibt keineSSI
zu bekommen sein. Also die Analogie, die mir einfällt, ist serielle vs. parallele Verdrahtung Weihnachtsbeleuchtung.%.% = serial
ggplot() + = parallel
. Dies ist ein nonprogrammer Verständnis der Dinge und der R-gurus kommen und mir sagen ich bin dumm, aber für jetzt, das ist die beste Theorie, die Sie haben.