F-test auf Fixe Effekte in R (Panel-Daten)
Ich versuche zu tun, ein F-test auf die gemeinsame Signifikanz der festen Effekte (individuelle-spezifische dummy-Variablen) auf einem panel data OLS-regression (in R), allerdings habe ich keinen Weg gefunden, diese Aufgabe für eine große Anzahl von festen Effekte. Im Idealfall würde ich eine Funktion verwenden, die in der plm
Paket, aber ich habe nicht gefunden was das konkret bedeutet dies testen.
Dies ist etwas, Stata automatisch bei Verwendung der xtreg, fe
Befehl. In Stata werden die Ergebnisse wie folgt aussieht:
------------------------------------------------------------------------------
F test that all u_i=0: F(49, 498) = 12.00 Prob > F = 0.000
Wieder, ich bin versucht zu reproduzieren, die Stata-Folge in R für eine große Zahl von dummy-Variablen, vielleicht angegeben + factor(us.state)
mit lm()
oder model = "fe"
mit plm()
.
Hier ist eine reproduzierbare Beispiel:
require(foreign)
voter <- read.dta("http://www.montana.edu/econ/cstoddard/562/panel_hw.dta")
reg1 <- lm(vaprate ~ gsp + midterm + regdead + WNCentral + South + Border
+ factor(state), data=voter)
das ist gleichbedeutend mit dem folgenden "in" regression mit der plm
Paket.
require(plm)
reg1.fe <- plm(vaprate ~ gsp + midterm + regdead + WNCentral + South + Border,
data=voter, index = c("state","year"), model = "within")
So, der test wäre der test, dass alle staatlichen dummy-Variablen werden gemeinsam von null Verschieden (gemeinsam signifikant). Dies ist eine lineare Beschränkung auf das uneingeschränkte Modell (reg1 reg1 und.fe oben). Dieser F-test ist besser erklärt in dem folgenden Dokument (siehe Folien 5-7).
http://jackman.stanford.edu/classes/350B/07/ftestforWeb.pdf
Hier ist einer meiner kläglichen versuche, auf die Schaffung einer 'R' - matrix für den F-test mit Nullhypothese: Rb = q wobei b die matrix der Koeffizienten (beta hat), und q ist ein Vektor aus Nullen.
d1 = length(unique(voter$stcode))-1
d2 = length(reg1$coefficients)
R = cbind(matrix(0,d1,d2),diag(d1))
linearHypothesis(reg1,R,rhs=0)
Diese funktioniert nicht! Und, ich hoffe, es gibt einen optimierten Ansatz für die Test für die gemeinsame Signifikanz aller festen Effekt der dummy-Variablen.
Du musst angemeldet sein, um einen Kommentar abzugeben.
Erstmal, ich würde gerne vorschlagen, dass deine Frage könnte verbessert werden, indem (1) ein reproduzierbares Beispiel, und (2) beschreiben Sie die genaue Prüfung, auf die Sie sich beziehen, wenn Sie sagen, 'F-test'. Ein link zu der Stata-docs vielleicht? F ist die distribution, so dass es sein kann, eine Unmenge von tests, genannt "F-test".
Wenn Ihre materiellen Interesse liegt in der Feststellung, ob der fixed-effects-Modell passt zu den Daten wesentlich besser als OLS ohne fixe Effekte, dann könnte man immer mit einem likelihood-ratio-test. Ich bin sicher, es gibt viele Implementierungen, die in R, aber die von der
lmtest
Paket ist ziemlich bequem. Hier ist ein Beispiel mit einem dataset verteilt, mitplm
- Paket (Sie scheinen zu haben, dass das installiert, also sollte es einfach zu versuchen).und die Ausgabe:
EDIT: OPTION 2
AUSGABE:
Ich glaube wirklich nicht, dass dieser test ist sinnvoll, bei allen. Stattdessen abzuschätzen, was Sie rufen einen fixierten Effekt (ich nenne es nicht-pooling-Modell), warum nicht ein hierarchisches Modell? Das hierarchische Modell (oder partiellen pooling-Modell) können für Ihre Einschätzungen zu schrumpfen, um die commom bedeuten, für Staaten, aber ohne dass Sie gleich zu sein. Darüber hinaus, wenn Sie brauchen, um zu beurteilen, wie viel Staaten variieren, Sie brauchen nur zu verwenden die geschätzte Varianz zwischen Staat und innerhalb des Staates. Wenn die Varianz unter den Staat ist gering (nahe null), als Sie nicht zu gewinnen, so viel über ein hierarchisches Modell und die Abschnitte sind etwa die gleichen. Wenn die Varianz sehr groß (in der Grenze, wenn die geht bis unendlich) die hierarchischen Modell fügt wenig und man könnte ein Modell getrennt für jedes Bundesland.
Können Sie schätzen ein hierarchisches Modell in R mit dem Paket lme4. Verwendung Ihrer Daten:
Die geschätzte Standardabweichung des Achsenabschnitt von Staaten 4.39 und die Standardabweichung von einzelnen 4.19.