Skalierung der unabhängigen Variablen, während die Vorhersage mit linearen Regressionsmodell
Ich versuche, ein lineares Modell wobei Y die abhängige variable und X1, X2, X3 sind meine unabhängigen Variablen.
Skaliert haben meine Eingabe mit 'scale-Methode in R und habe die eo-efficients und abfangen.
Y = a1X1 + a2X2 + a3X3 + c
Nun, zur Vorhersage von Y bei gegebenen Wert von (X1, X2, X3), ist es in Ordnung direkt berechnen den Wert von Y unter Verwendung der obigen Gleichung oder sollte die input-Variablen werden skaliert, bevor man Sie in die Gleichung ?
Wenn ja, wie können wir Sie skalieren ?
Du musst angemeldet sein, um einen Kommentar abzugeben.
Wenn Sie ein Trainings-set (original-Daten) und test-set (neue Daten) und bauen Sie ein Modell mit dem Trainings-set skaliert auf [0,1], dann, wenn Sie Vorhersagen mit diesem Modell mit der test-set, die Sie haben, zu skalieren, die erste sowie. Aber Vorsicht: Sie müssen zum Maßstab der test mit den gleichen Parameter wie das training-set. Also, wenn Sie
x-min(x)/(max(x)-min(x))
zu skalieren, müssen Sie die Werte vonmax(x)
undmin(x)
von der Ausbildung dataset. Hier ist ein Beispiel:Beachten Sie, dass, wie erwartet, die Skalierung wirkt sich auf den Wert des Koeffizienten (natürlich...), nicht aber die t-Werte, oder die se von der Passform, oder BESTIMMTHEITSMASS, oder F (ich habe nur reproduziert, Teil der Zusammenfassungen hier).
Nun vergleichen wir den Effekt der Skalierung mit einem test-Datensatz.
Also Vorhersagen unter Verwendung der un-skalierte fit mit un-skalierte Daten ergibt genau das gleiche Ergebnis als Vorhersage über die skalierte fit mit der skalierten Daten.
Die input-Variablen skaliert werden soll, in der gleichen Weise, wie Sie Ihre anfängliche Skalierung.
Lesen Sie die Dokumentation für den Befehl, den Sie verwendet (
?scale
) und sehen, was er Tat! Dann replizieren, für Sie neue Vorhersage-Daten. Wenn Sie die Standardeinstellungen, es abgezogen, das heißt von Ihrer ursprünglichen Prädiktoren, dividiert durch die Standardabweichung. Sie sollten zurück in den raw-Daten, berechnen Sie die Mittelwerte und Standardabweichungen, und skalieren Sie Ihre Daten für die Vorhersage in der gleichen Weise.Transformieren ausgestattet Koeffizienten
Ihre andere option ist zum transformieren der Koeffizienten. Dies dauert nur ein bisschen algebra. Wenn deine Skalierung ist
f(x) = mx + b
, und Ihr Modell ausgestattet isty = a * f(x)
, es ist leicht zu sehen, dassSo, mit nicht-transformierten Daten
x
Ihre Steigung ista * m
und Ihren Achsenabschnitta * b + c
. Dies ist leicht erweitert werden, um mehrere Variablen oder eine andere transformation. Wenn Sie die Transformation auf [0, 1], Ihre transformation ist wahrscheinlichf(x) = (x - min(x)) /(max(x) - min(x))
... die algebra sollte nicht schwierig sein, aber ich überlasse es dir.