Skalierung von Daten in R zu ignorieren, dass bestimmte Spalten
Ich habe einige Daten im csv-format, das ich verwenden möchten, für die prädiktive Modellierung. Ich lese die Daten in R und gelten einige einfache Vorverarbeitung (ommitting NA usw.). Bevor ich trainieren möchten, ein SVM-Klassifizierer ich möchte die Skalierung der Daten mit Hilfe der Skala(x) - Funktion. Das problem ist, dass meine Spalte ist Teil des datasets. Wie kann ich sagen, R, um zu ignorieren, dass die Spalten? Oder was ist die best practice hier?
label, X1, X2, X3, ..., Xn
Y, 34, 74, 29, ..., 47
N, 88, 46, 95, ..., 33
N, 58, 78, 25, ..., 68
Y, 33, 56, 61, ..., 13
Wenn ich versuchen:
x <- scale(trouble[,-c(1)])
trouble <- x
summary(trouble)
rm(x);
Die erste Spalte wird gelöscht und gut gegangen.
Du musst angemeldet sein, um einen Kommentar abzugeben.
können Sie tun teilauftrag:
Sollten Sie feststellen, dass
scale
arbeitet auch aufdata.frame
Objekte.Gibt...
EDIT:
Können Sie die Verwendung von negativen Indizes nur mit numerischen Indizes. Wenn Sie den Namen einer Spalte aus, die Sie nicht verwenden können, negative Indizes, also
dtf[-"label"]
wird nicht funktionieren. In diesem Fall können Sie verwendenwhich
,%in%
, und konzentrieren sich auf logische Indizes.