Maßstab zurück linearen Regressionskoeffizienten R von skalierten und zentrierten Daten
Bin ich den Einbau eines linearen Modells mit OLS und skaliert haben meine Regressoren mit der Funktion Skalierung in R wegen der unterschiedlichen Maßeinheiten zwischen den Variablen. Dann passte ich das Modell mit den lm-Befehl aus und erhalten die Koeffizienten der angepassten Modell. Soweit ich weiß, werden die Koeffizienten des eingebauten Modell nicht in der gleichen Einheiten der ursprünglichen Regressoren Variablen und muss deshalb herabgesetzt werden, bevor Sie interpretiert werden kann. Ich habe die Suche nach einem direkten Weg, es zu tun, indem Sie etwas nicht finden konnte. Weiß jemand wie das geht?
Bitte haben Sie einen Blick auf den code, können Sie mir bitte helfen umzusetzen, was du vorgeschlagen?
library(zoo)
filename="DataReg4.csv"
filepath=paste("C:/Reg/",filename, sep="")
separator=";"
readfile=read.zoo(filepath, sep=separator, header=T, format = "%m/%d/%Y", dec=".")
readfile=as.data.frame(readfile)
str(readfile)
DF=readfile
DF=as.data.frame(scale(DF))
fm=lm(USD_EUR~diff_int+GDP_US+Net.exports.Eur,data=DF)
summary(fm)
plot(fm)
Tut mir Leid, das sind die Daten.
- Soweit ich weiß, ich glaube nicht, dass Sie skalieren müssen, bevor Sie passen das lineare Modell. Auch können Sie einige reproduzierbare Beispiel im Fall verstehe ich falsch?
- Hi, du hast Recht im Allgemeinen, aber ich habe gelernt, dass ist eine gute Praxis, wenn es Anzeichen von multicollinearity oder die Einheiten der Messungen unterscheidet sich erheblich zwischen den regressor-Variablen. Ich arbeite in einem Spielzeug Beispiel, wo ich den USD.EUR als Reaktion und das Bruttoinlandsprodukt (BIP, Exporte, Importe, etc als Regressoren. Es gibt einen hohen Grad von multicollinearity im eingebauten Modell. Viele verschiedene Techniken könnte getestet werden, aber jetzt möchte ich, das einmal zu überprüfen.
- Sie tun es nicht, aber wenn Sie wollen, vergleichen Sie die Effekt-Größen helfen bei der interpretation des Modells, die Bedeutung von Variablen, etc, dann, wenn diese Variablen gemessen auf unterschiedlichen Skalen, die Standardisierung von Ihnen ist ein Weg, um einen gemeinsamen Maßstab für den Vergleich.
- und Gavin. Vielen Dank für die Ratschläge. Viel gelernt hat.
Du musst angemeldet sein, um einen Kommentar abzugeben.
Wenn ich verstehe deine Beschreibung (das ist leider im moment code-free), sind Sie immer standardisierte Regressionskoeffizienten für Y ~ As + Bs*Xs, wo all diese "s" - Elemente sind skalierten Variablen. Die Koeffizienten sind dann die prognostizierte Veränderung auf eine std Abweichung Skalierung der Y-verbunden mit einer änderung in der X für eine Standardabweichung von X. Die
scale
- Funktion erfasst die Mittelwerte und Standardabweichungen der Attribute für hte skaliertes Objekt. Wenn nicht, dann haben Sie diesen Schätzungen irgendwo in der Konsole anmelden. Die geschätzte änderung in dY bei einer änderung von dX in X sein sollte: dY*(1/sdY) = Bs*dX*(1/sdX). Vorhersagen sollte etwas entlang diesen Linien:Sollte man wohl nicht nötig zu standardisieren, die Y-Werte, und ich bin der Hoffnung, dass Sie nicht, weil es macht den Umgang mit der Anpassung für die Mittel von X ist einfacher. Fügen Sie einige code und Beispiel-Daten, wenn Sie wollen, umgesetzt und überprüft die Antworten. Ich denke, @DanielGerlance korrekt ist, zu sagen, zu multiplizieren statt dividieren Sie durch die SD ist.
Wenn Sie die
scale
Funktion mit default-Argumenten dann Ihre Regressoren wird zentriert (Subtraktion Ihren Mittelwert) und dividiert durch deren Standardabweichungen. Interpretieren Sie die Koeffizienten ohne die Umwandlung Sie zurück zu den ursprünglichen Einheiten:Hält alles andere konstant, im Durchschnitt eine Standardabweichung änderung in einem der Regressoren ist verbunden mit einem Wechsel in die abhängige variable, die entsprechend dem Koeffizienten der regressor.
Wenn Sie in einem intercept-term im Modell im Hinterkopf behalten, dass die interpretation der intercept wird sich ändern. Der geschätzte Achsenabschnitt repräsentiert nun das Durchschnittliche Niveau der abhängigen variable, wenn alle Regressoren sind in Ihrer durchschnittlichen Niveau. Dies ist ein Ergebnis der Subtraktion der Mittelwert von jeder variable.
Interpretieren Sie die Koeffizienten in nicht-standard-Abweichung Begriffe, berechnen Sie die Standardabweichung der einzelnen regressor und mehrere, die durch die Koeffizienten.
To de-scale-oder zurück-transformieren regression Koeffizienten aus einer regression erfolgt mit skalierten Prädiktor-variable(s) und nicht-skalierte abhängige variable der Achsenabschnitt und die Steigung berechnet werden soll, wie:
also die regression ist,
wo
Diese können angepasst werden, wenn
Y
war auch skaliert, aber es scheint, dass Sie beschlossen, nicht zu tun, die letztlich mit Ihrem dataset.