Skalierung von Daten in R zu ignorieren, dass bestimmte Spalten

Ich habe einige Daten im csv-format, das ich verwenden möchten, für die prädiktive Modellierung. Ich lese die Daten in R und gelten einige einfache Vorverarbeitung (ommitting NA usw.). Bevor ich trainieren möchten, ein SVM-Klassifizierer ich möchte die Skalierung der Daten mit Hilfe der Skala(x) - Funktion. Das problem ist, dass meine Spalte ist Teil des datasets. Wie kann ich sagen, R, um zu ignorieren, dass die Spalten? Oder was ist die best practice hier?

label,  X1, X2, X3, ..., Xn
Y,  34, 74, 29, ..., 47
N,  88, 46, 95, ..., 33
N,  58, 78, 25, ..., 68
Y,  33, 56, 61, ..., 13

Wenn ich versuchen:

x <- scale(trouble[,-c(1)])
trouble <- x
summary(trouble)
rm(x);

Die erste Spalte wird gelöscht und gut gegangen.

InformationsquelleAutor Christian Stade-Schuldt | 2011-11-14

6

können Sie tun teilauftrag:
```
trouble[, -c(1)] <- scale(trouble[, -c(1)])
```
InformationsquelleAutor kohske

Sollten Sie feststellen, dass scale arbeitet auch auf data.frame Objekte.

dtf <- read.table(text = "label,  X1, X2, X3, ..., Xn
+ Y,  34, 74, 29, ..., 47
+ N,  88, 46, 95, ..., 33
+ N,  58, 78, 25, ..., 68
+ Y,  33, 56, 61, ..., 13
+ ", sep = ",", header = TRUE)
> (dtf <- dtf[-5])
  label X1 X2 X3 Xn
1     Y 34 74 29 47
2     N 88 46 95 33
3     N 58 78 25 68
4     Y 33 56 61 13
> (dtf_scales <- scale(dtf[-1]))
             X1         X2         X3         Xn
[1,] -0.7435537  0.6958884 -0.7210036  0.2913066
[2,]  1.3422592 -1.1598139  1.3039428 -0.3128849
[3,]  0.1834743  0.9609887 -0.8437277  1.1975938
[4,] -0.7821798 -0.4970631  0.2607886 -1.1760155
attr(,"scaled:center")
   X1    X2    X3    Xn 
53.25 63.50 52.50 40.25 
attr(,"scaled:scale")
      X1       X2       X3       Xn 
25.88919 15.08863 32.59346 23.17146

Gibt...

EDIT:

Können Sie die Verwendung von negativen Indizes nur mit numerischen Indizes. Wenn Sie den Namen einer Spalte aus, die Sie nicht verwenden können, negative Indizes, also dtf[-"label"] wird nicht funktionieren. In diesem Fall können Sie verwenden which, %in%, und konzentrieren sich auf logische Indizes.

InformationsquelleAutor aL3xa

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.