R Dplyr mutieren, ist die Berechnung der Standardabweichung für jede Zeile

Ich versuche zu berechnen, den Mittelwert und die Standardabweichung von bestimmten Spalten in einem data frame, und kehren Sie diese Werte für neue Spalten in der Daten-frame. Ich kann diese arbeiten für meine:

library(dplyr)
mtcars = mutate(mtcars, mean=(hp+drat+wt)/3)

Jedoch, wenn ich versuche, das gleiche für die Standardabweichung, ich habe ein Problem, denn ich kann nicht fest die Gleichung wie ich für meine, sehr leicht. So, ich versuche um eine Funktion zu verwenden, wie folgt:

mtcars = mutate(mtcars, mean=(hp+drat+wt)/3, stdev = sd(hp,drat,wt))

Resultieren in der Fehlermeldung "Error in sd(PS, verflixt, wt) : unused argument (wt)". Wie kann ich meine richtige syntax? Danke.

Um zu berechnen, die bedeuten, dass Sie tatsächlich schrieb die Formel, sondern um zu berechnen, SD man verwendet die eingebaute sd Funktion einige seltsame Art und Weise. Sieht es nicht inkonsistent, Sie?
Ja, das ist der Grund, warum ich sagte "wenn ich versuche, das gleiche für die Standardabweichung, ich habe ein Problem, denn ich kann nicht fest die Gleichung wie ich für meine, sehr leicht. So, ich versuche um eine Funktion zu verwenden." Ich bin nicht sicher, warum Sie denken, dass ich verwendet die sd-Funktion auf seltsame Weise, obwohl ich sicher bin, das ist wahr. Die sd-Funktion scheint in einem Vektor von numerischen, zum Beispiel sd(c(3,5,6)). Obwohl ich sicher bin, dass es für Sie offensichtlich, warum ist das, was ich Tue, nicht richtig ist? Danke.
Vielleicht das, was @DavidArenburg ist darauf hindeutet, ist, dass Ihr Anruf an sd ist falsch, was es ist, in eine allgemein falsche Art und Weise. Zum Beispiel, versuchen Sie sd(1,2,3), dann Lesen Sie ?sd und sehen (1), es beschreibt das erste argument als "x: ein numerischer Vektor", und (2) es ist insbesondere nicht enthalten "..." (Ellipsen, die erlauben würde, für eine beliebige Anzahl von Argumenten, wie Sie sind, providing).
Mit + zu bekommen, bedeuten möglicherweise nicht erwartungsgemäß, wenn es NA ' s, In die mean und rowMeans ist, gibt es Optionen für das entfernen von NA, dh. na.rm=TRUE.

InformationsquelleAutor | 2015-04-11

dplyr r

5

Könnten Sie versuchen,
```
library(dplyr)
library(matrixStats)
nm1 <- c('hp', 'drat', 'wt')
res1 <- mtcars %>% 
           mutate(Mean= rowMeans(.[nm1]), stdev=rowSds(as.matrix(.[nm1])))

head(res1,3)
#   mpg cyl disp  hp drat    wt  qsec vs am gear carb     Mean    stdev
#1 21.0   6  160 110 3.90 2.620 16.46  0  1    4    4 38.84000 61.62969
#2 21.0   6  160 110 3.90 2.875 17.02  0  1    4    4 38.92500 61.55489
#3 22.8   4  108  93 3.85 2.320 18.61  1  1    4    1 33.05667 51.91809
```
Oder mit do
```
res2 <- mtcars %>% 
             rowwise() %>%
             do(data.frame(., Mean=mean(unlist(.[nm1])),
                         stdev=sd(unlist(.[nm1]))))

head(res2,3)
#   mpg cyl disp  hp drat    wt  qsec vs am gear carb     Mean    stdev
#1 21.0   6  160 110 3.90 2.620 16.46  0  1    4    4 38.84000 61.62969
#2 21.0   6  160 110 3.90 2.875 17.02  0  1    4    4 38.92500 61.55489
#3 22.8   4  108  93 3.85 2.320 18.61  1  1    4    1 33.05667 51.91809
```
- Danke, aber wenn ich deinen ersten code erhalte ich die Fehlermeldung "Fehler in .[nm1] : object of type 'Verschluss' ist nicht subsettable"
- Ich bin mir nicht sicher über das problem. Sind Sie mit den letzten Versionen von dplyr? Ich verwendet dplyr_0.4.1.9000
- Danke @akrun. Ich habe einfach installieren.Pakete("dplyr") und dann sessionInfo() zeigte, es war die version dplyr_0.4.1 . Ich reran Sie den code und habe den gleichen Fehler!
- Können Sie versuchen, durch mtcars %>% mutate(.. wie bei der Aktualisierung.
- Wählen Sie die Spalten, so sollten Sie Bearbeiten as.matrix(.[nm1]) zu as.matrix(.[ ,nm1]).
- Wir wählten die Spalten von Daten.Rahmen für die .[nm1] bekommt die Spalten, die standardmäßig angezeigt wird, und dann nur konvertiert matrix. Wenn es wurde bereits eine matrix, dann .[, nm1] wäre der richtige Weg. Also, in diesem Fall, entweder man arbeitet. Wenn Sie Zweifel haben, überprüfen Sie bitte das Ergebnis der beiden Fällen die gleiche wäre.
InformationsquelleAutor akrun

Können Sie auch schreiben Sie Ihre eigene vektorisierte RowSD Funktion, wie in

RowSD <- function(x) {
  sqrt(rowSums((x - rowMeans(x))^2)/(dim(x)[2] - 1))
}

dann

mtcars %>% 
  mutate(mean = (hp + drat + wt)/3, stdev = RowSD(cbind(hp, drat, wt)))
##     mpg cyl  disp  hp drat    wt  qsec vs am gear carb      mean     stdev
## 1  21.0   6 160.0 110 3.90 2.620 16.46  0  1    4    4  38.84000  61.62969
## 2  21.0   6 160.0 110 3.90 2.875 17.02  0  1    4    4  38.92500  61.55489
## 3  22.8   4 108.0  93 3.85 2.320 18.61  1  1    4    1  33.05667  51.91809
## 4  21.4   6 258.0 110 3.08 3.215 19.44  1  0    3    1  38.76500  61.69136
## 5  18.7   8 360.0 175 3.15 3.440 17.02  0  0    3    2  60.53000  99.13403
## 6  18.1   6 225.0 105 2.76 3.460 20.22  1  0    3    1  37.07333  58.82726
## ...

InformationsquelleAutor David Arenburg

Nicht viel Veränderung nötig, fügen Sie einfach rowwise() (danke @akrun für den Kommentar) und wickeln Sie den Spaltennamen in c(...) (um den Fehler zu beheben):

library(dplyr)
mtcars %>%
    rowwise() %>%
    mutate(mean=(hp+drat+wt)/3, stdev = sd(c(hp,drat,wt)))
## Source: local data frame [32 x 13]
## Groups: <by row>
##     mpg cyl  disp  hp drat    wt  qsec vs am gear carb     mean     stdev
## 1  21.0   6 160.0 110 3.90 2.620 16.46  0  1    4    4 38.84000  61.62969
## 2  21.0   6 160.0 110 3.90 2.875 17.02  0  1    4    4 38.92500  61.55489
## 3  22.8   4 108.0  93 3.85 2.320 18.61  1  1    4    1 33.05667  51.91809
## 4  21.4   6 258.0 110 3.08 3.215 19.44  1  0    3    1 38.76500  61.69136
## 5  18.7   8 360.0 175 3.15 3.440 17.02  0  0    3    2 60.53000  99.13403
## 6  18.1   6 225.0 105 2.76 3.460 20.22  1  0    3    1 37.07333  58.82726
## 7  14.3   8 360.0 245 3.21 3.570 15.84  0  0    3    4 83.92667 139.49371
## 8  24.4   4 146.7  62 3.69 3.190 20.00  1  0    4    2 22.96000  33.81056
## 9  22.8   4 140.8  95 3.92 3.150 22.90  1  0    4    2 34.02333  52.80875
## 10 19.2   6 167.6 123 3.92 3.440 18.30  1  0    4    4 43.45333  68.88985
## ..  ... ...   ... ...  ...   ...   ... .. ..  ...  ...      ...       ...

Hallo, Verwenden Sie denselben Befehl geben mich identisch mit dem Wert für die sd. meine ist in Ordnung. Finden Sie in der folgenden Ausgabe

InformationsquelleAutor r2evans

@r2evans Verwenden Sie denselben Befehl geben mich identisch mit dem Wert für die sd. meine ist in Ordnung. Finden Sie in der folgenden Ausgabe

> mtcars %>%
+         rowwise() %>%
+         mutate(mean=(hp+drat+wt)/3, stdev = sd(c(hp,drat,wt)))
Source: local data frame [32 x 13]
Groups: <by row>

# A tibble: 32 x 13
     mpg   cyl  disp    hp  drat    wt  qsec    vs    am  gear  carb     mean    stdev
 * <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>    <dbl>    <dbl>
 1  21.0     6 160.0   110  3.90 2.620 16.46     0     1     4     4 38.84000 78.38681
 2  21.0     6 160.0   110  3.90 2.875 17.02     0     1     4     4 38.92500 78.38681
 3  22.8     4 108.0    93  3.85 2.320 18.61     1     1     4     1 33.05667 78.38681
 4  21.4     6 258.0   110  3.08 3.215 19.44     1     0     3     1 38.76500 78.38681
 5  18.7     8 360.0   175  3.15 3.440 17.02     0     0     3     2 60.53000 78.38681
 6  18.1     6 225.0   105  2.76 3.460 20.22     1     0     3     1 37.07333 78.38681
 7  14.3     8 360.0   245  3.21 3.570 15.84     0     0     3     4 83.92667 78.38681
 8  24.4     4 146.7    62  3.69 3.190 20.00     1     0     4     2 22.96000 78.38681
 9  22.8     4 140.8    95  3.92 3.150 22.90     1     0     4     2 34.02333 78.38681
10  19.2     6 167.6   123  3.92 3.440 18.30     1     0     4     4 43.45333 78.38681
# ... with 22 more rows

Ich habe keine Ahnung, der code läuft gut in R-3.3.3-und R-3.4.3. Hinzufügen deine Frage/problem eine Antwort hier ist nicht der beste Weg, um Hilfe zu bitten, als eine "Antwort" ist für die vorgeschlagenen Lösungen auf die ursprüngliche Frage, nicht ein Ort, um zu diskutieren, zusätzliche Probleme. Dies ist ein anderes problem, jedenfalls seit der OP hat gefragt, wie, es zu tun, und Sie versuchen, auf die Jagd nach diesem neuen problem mit scheinbar harmlosen code. Bitte löschen Sie diese Antwort und die post eine neue Frage; verweisen auf diese Antwort in dieser Frage angemessen ist und eine gute Sache, IMO.

InformationsquelleAutor Chirag

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.