Maßstab zurück linearen Regressionskoeffizienten R von skalierten und zentrierten Daten

Bin ich den Einbau eines linearen Modells mit OLS und skaliert haben meine Regressoren mit der Funktion Skalierung in R wegen der unterschiedlichen Maßeinheiten zwischen den Variablen. Dann passte ich das Modell mit den lm-Befehl aus und erhalten die Koeffizienten der angepassten Modell. Soweit ich weiß, werden die Koeffizienten des eingebauten Modell nicht in der gleichen Einheiten der ursprünglichen Regressoren Variablen und muss deshalb herabgesetzt werden, bevor Sie interpretiert werden kann. Ich habe die Suche nach einem direkten Weg, es zu tun, indem Sie etwas nicht finden konnte. Weiß jemand wie das geht?

Bitte haben Sie einen Blick auf den code, können Sie mir bitte helfen umzusetzen, was du vorgeschlagen?

library(zoo)
filename="DataReg4.csv"
filepath=paste("C:/Reg/",filename, sep="")
separator=";"
readfile=read.zoo(filepath, sep=separator, header=T, format = "%m/%d/%Y", dec=".")
readfile=as.data.frame(readfile)
str(readfile)
DF=readfile
DF=as.data.frame(scale(DF)) 
fm=lm(USD_EUR~diff_int+GDP_US+Net.exports.Eur,data=DF)
summary(fm)
plot(fm)

Tut mir Leid, das sind die Daten.

http://www.mediafire.com/?hmcp7urt0ag8187

Soweit ich weiß, ich glaube nicht, dass Sie skalieren müssen, bevor Sie passen das lineare Modell. Auch können Sie einige reproduzierbare Beispiel im Fall verstehe ich falsch?
Hi, du hast Recht im Allgemeinen, aber ich habe gelernt, dass ist eine gute Praxis, wenn es Anzeichen von multicollinearity oder die Einheiten der Messungen unterscheidet sich erheblich zwischen den regressor-Variablen. Ich arbeite in einem Spielzeug Beispiel, wo ich den USD.EUR als Reaktion und das Bruttoinlandsprodukt (BIP, Exporte, Importe, etc als Regressoren. Es gibt einen hohen Grad von multicollinearity im eingebauten Modell. Viele verschiedene Techniken könnte getestet werden, aber jetzt möchte ich, das einmal zu überprüfen.
Sie tun es nicht, aber wenn Sie wollen, vergleichen Sie die Effekt-Größen helfen bei der interpretation des Modells, die Bedeutung von Variablen, etc, dann, wenn diese Variablen gemessen auf unterschiedlichen Skalen, die Standardisierung von Ihnen ist ein Weg, um einen gemeinsamen Maßstab für den Vergleich.
und Gavin. Vielen Dank für die Ratschläge. Viel gelernt hat.

InformationsquelleAutor nopeva | 2013-01-24

r regression transform

4

Wenn ich verstehe deine Beschreibung (das ist leider im moment code-free), sind Sie immer standardisierte Regressionskoeffizienten für Y ~ As + Bs*Xs, wo all diese "s" - Elemente sind skalierten Variablen. Die Koeffizienten sind dann die prognostizierte Veränderung auf eine std Abweichung Skalierung der Y-verbunden mit einer änderung in der X für eine Standardabweichung von X. Die scale - Funktion erfasst die Mittelwerte und Standardabweichungen der Attribute für hte skaliertes Objekt. Wenn nicht, dann haben Sie diesen Schätzungen irgendwo in der Konsole anmelden. Die geschätzte änderung in dY bei einer änderung von dX in X sein sollte: dY*(1/sdY) = Bs*dX*(1/sdX). Vorhersagen sollte etwas entlang diesen Linien:
```
Yest = As*(sdX) + Xmn + Bs*(Xs)*(sdX)
```
Sollte man wohl nicht nötig zu standardisieren, die Y-Werte, und ich bin der Hoffnung, dass Sie nicht, weil es macht den Umgang mit der Anpassung für die Mittel von X ist einfacher. Fügen Sie einige code und Beispiel-Daten, wenn Sie wollen, umgesetzt und überprüft die Antworten. Ich denke, @DanielGerlance korrekt ist, zu sagen, zu multiplizieren statt dividieren Sie durch die SD ist.
- Danke für deine Antwort ich habe meinen code. Es ist mir nicht klar, ob die Multiplikation der Koeffizienten durch Ihre Standardabweichung-Stichprobe ist genug, um die Skala der Koeffizienten zurück. Ich bin mit einem abfangen, aber das Ergebnis ist abzuschätzen, 0-und p-Wert 1 können Sie mir helfen Dolmetschen?
- Das abfangen in einem solchen Modell (wo Sie skaliert die Y-als auch X) null sein muß, da Sie abgezogen, bedeutet, alles in den scaling-Prozess. Deshalb habe ich Sie wieder Hinzugefügt das bedeutet in meinen korrigierten Ausdruck. (Müssen Sie auch wieder hinzufügen der Y_mean.) Die Wald-Statistik ist für einen test von theIntercept null ist, und es ist, so macht es Sinn, dass der p-Wert wäre 1. Das ist der code, aber nicht die Daten.
- Danke, ich habe schließlich skaliert die X ' s nur und multipliziert die Koeffizienten der sds.
- Ich war mit dieser Antwort zurück-transformieren/entkalken ein Rückschritt und ich glaube nicht, dass die Formel in dieser Antwort ganz richtig. Siehe meine neue Antwort für eine andere Lösung.
InformationsquelleAutor 42-
9

Wenn Sie die scale Funktion mit default-Argumenten dann Ihre Regressoren wird zentriert (Subtraktion Ihren Mittelwert) und dividiert durch deren Standardabweichungen. Interpretieren Sie die Koeffizienten ohne die Umwandlung Sie zurück zu den ursprünglichen Einheiten:

Hält alles andere konstant, im Durchschnitt eine Standardabweichung änderung in einem der Regressoren ist verbunden mit einem Wechsel in die abhängige variable, die entsprechend dem Koeffizienten der regressor.

Wenn Sie in einem intercept-term im Modell im Hinterkopf behalten, dass die interpretation der intercept wird sich ändern. Der geschätzte Achsenabschnitt repräsentiert nun das Durchschnittliche Niveau der abhängigen variable, wenn alle Regressoren sind in Ihrer durchschnittlichen Niveau. Dies ist ein Ergebnis der Subtraktion der Mittelwert von jeder variable.

Interpretieren Sie die Koeffizienten in nicht-standard-Abweichung Begriffe, berechnen Sie die Standardabweichung der einzelnen regressor und mehrere, die durch die Koeffizienten.
- vielen Dank für deine Erklärungen
InformationsquelleAutor Daniel Gerlanc
1

To de-scale-oder zurück-transformieren regression Koeffizienten aus einer regression erfolgt mit skalierten Prädiktor-variable(s) und nicht-skalierte abhängige variable der Achsenabschnitt und die Steigung berechnet werden soll, wie:
```
A = As - Bs*Xmean/sdx
B = Bs/sdx
```
also die regression ist,
```
Y = As - Bs*Xmean/sdx + Bs/sdx * X
```
wo
```
As = intercept from the scaled regression
Bs = slope from the scaled regression
Xmean = the mean of the scaled predictor variable
sdx = the standard deviation of the predictor variable
```
Diese können angepasst werden, wenn Y war auch skaliert, aber es scheint, dass Sie beschlossen, nicht zu tun, die letztlich mit Ihrem dataset.

InformationsquelleAutor DirtStats

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.