F-test auf Fixe Effekte in R (Panel-Daten)

Ich versuche zu tun, ein F-test auf die gemeinsame Signifikanz der festen Effekte (individuelle-spezifische dummy-Variablen) auf einem panel data OLS-regression (in R), allerdings habe ich keinen Weg gefunden, diese Aufgabe für eine große Anzahl von festen Effekte. Im Idealfall würde ich eine Funktion verwenden, die in der plm Paket, aber ich habe nicht gefunden was das konkret bedeutet dies testen.

Dies ist etwas, Stata automatisch bei Verwendung der xtreg, fe Befehl. In Stata werden die Ergebnisse wie folgt aussieht:

------------------------------------------------------------------------------
F test that all u_i=0:  F(49, 498) =    12.00   Prob > F = 0.000

Wieder, ich bin versucht zu reproduzieren, die Stata-Folge in R für eine große Zahl von dummy-Variablen, vielleicht angegeben + factor(us.state) mit lm() oder model = "fe" mit plm().

Hier ist eine reproduzierbare Beispiel:

require(foreign)

voter <- read.dta("http://www.montana.edu/econ/cstoddard/562/panel_hw.dta")

reg1 <- lm(vaprate ~ gsp + midterm + regdead + WNCentral + South + Border
               + factor(state), data=voter)

das ist gleichbedeutend mit dem folgenden "in" regression mit der plm Paket.

require(plm)

reg1.fe <- plm(vaprate ~ gsp + midterm + regdead + WNCentral + South + Border,
data=voter, index = c("state","year"), model = "within")

So, der test wäre der test, dass alle staatlichen dummy-Variablen werden gemeinsam von null Verschieden (gemeinsam signifikant). Dies ist eine lineare Beschränkung auf das uneingeschränkte Modell (reg1 reg1 und.fe oben). Dieser F-test ist besser erklärt in dem folgenden Dokument (siehe Folien 5-7).

http://jackman.stanford.edu/classes/350B/07/ftestforWeb.pdf

Hier ist einer meiner kläglichen versuche, auf die Schaffung einer 'R' - matrix für den F-test mit Nullhypothese: Rb = q wobei b die matrix der Koeffizienten (beta hat), und q ist ein Vektor aus Nullen.

d1 = length(unique(voter$stcode))-1
d2 = length(reg1$coefficients)
R = cbind(matrix(0,d1,d2),diag(d1))

linearHypothesis(reg1,R,rhs=0)

Diese funktioniert nicht! Und, ich hoffe, es gibt einen optimierten Ansatz für die Test für die gemeinsame Signifikanz aller festen Effekt der dummy-Variablen.

InformationsquelleAutor baha-kev | 2011-05-29

plm r stata

1

Erstmal, ich würde gerne vorschlagen, dass deine Frage könnte verbessert werden, indem (1) ein reproduzierbares Beispiel, und (2) beschreiben Sie die genaue Prüfung, auf die Sie sich beziehen, wenn Sie sagen, 'F-test'. Ein link zu der Stata-docs vielleicht? F ist die distribution, so dass es sein kann, eine Unmenge von tests, genannt "F-test".

Wenn Ihre materiellen Interesse liegt in der Feststellung, ob der fixed-effects-Modell passt zu den Daten wesentlich besser als OLS ohne fixe Effekte, dann könnte man immer mit einem likelihood-ratio-test. Ich bin sicher, es gibt viele Implementierungen, die in R, aber die von der lmtest Paket ist ziemlich bequem. Hier ist ein Beispiel mit einem dataset verteilt, mit plm - Paket (Sie scheinen zu haben, dass das installiert, also sollte es einfach zu versuchen).
```
library(plm)
data(Produc)

library(lmtest)
mod <- lm(pcap ~ hwy + water, Produc)
mod.fe <- lm(pcap ~ hwy + water + factor(state), Produc)
lrtest(mod, mod.fe)  
```
und die Ausgabe:
```
Likelihood ratio test

Model 1: pcap ~ hwy + water
Model 2: pcap ~ hwy + water + factor(state)
  #Df  LogLik Df  Chisq Pr(>Chisq)    
1   4 -8038.1                         
2  51 -6712.4 47 2651.4  < 2.2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 
```
EDIT: OPTION 2
```
require(foreign)
voter <- read.dta("http://www.montana.edu/econ/cstoddard/562/panel_hw.dta")
reg1 <- lm(vaprate ~ gsp + midterm + regdead + WNCentral + South + Border
               + factor(state), data=voter)

library(plm)
reg1.fe <- plm(vaprate ~ gsp + midterm + regdead + WNCentral + South + Border,
data=voter, index = c("state","year"), model = "within")

reg1.pooling <- plm(vaprate ~ gsp + midterm + regdead + WNCentral + South + Border,
data=voter, index = c("state","year"), model = "pooling")

pFtest(reg1.fe, reg1.pooling)
```
AUSGABE:
```
    F test for individual effects

data:  vaprate ~ gsp + midterm + regdead + WNCentral + South + Border 
F = 13.0712, df1 = 45, df2 = 498, p-value < 2.2e-16
alternative hypothesis: significant effects 
```
- Hi Vincent, ich habe ein reproduzierbares Beispiel in meinem post. Vielen Dank für die Beantwortung. Ich bin jedoch versucht, zu replizieren genau die F-test-Ergebnisse. Aus einer empirischen Perspektive, ich verstehe, es gibt mehrere statistische tests zu vergleichen, die ein FE-Modell mit einem Modell ohne FE.
- Ich denke, dass plm die pFtest () - Funktion tun können, was Sie wollen (siehe meine Antwort bearbeitet). Das Ergebnis ist nicht genau das gleiche wie Ihre Stata-output, das ist wahrscheinlich aufgrund der Tatsache, dass der erste parameter der F-Verteilung ist anders. Aber wenn ich passen beide Modelle werden individuell mit lm(), ich bekomme Grad der Freiheit von 543 und 498 (Differenz 45), also R scheint hier richtig. Sehen Sie, wenn Sie den gleichen Grad der Freiheit in Stata, wenn Sie passen, die Zusammenlegung und in Modellen individuell. Das problem mit closed-source-software wie Stata ist wir werden nie genau wissen, wie Sie berechnen Ihre F-test.
InformationsquelleAutor Vincent
0

Ich glaube wirklich nicht, dass dieser test ist sinnvoll, bei allen. Stattdessen abzuschätzen, was Sie rufen einen fixierten Effekt (ich nenne es nicht-pooling-Modell), warum nicht ein hierarchisches Modell? Das hierarchische Modell (oder partiellen pooling-Modell) können für Ihre Einschätzungen zu schrumpfen, um die commom bedeuten, für Staaten, aber ohne dass Sie gleich zu sein. Darüber hinaus, wenn Sie brauchen, um zu beurteilen, wie viel Staaten variieren, Sie brauchen nur zu verwenden die geschätzte Varianz zwischen Staat und innerhalb des Staates. Wenn die Varianz unter den Staat ist gering (nahe null), als Sie nicht zu gewinnen, so viel über ein hierarchisches Modell und die Abschnitte sind etwa die gleichen. Wenn die Varianz sehr groß (in der Grenze, wenn die geht bis unendlich) die hierarchischen Modell fügt wenig und man könnte ein Modell getrennt für jedes Bundesland.

Können Sie schätzen ein hierarchisches Modell in R mit dem Paket lme4. Verwendung Ihrer Daten:
```
require(lme4)
require(arm)
reg1 <- glmer(vaprate ~ gsp + midterm + regdead + WNCentral + South + Border
           + (1|state), data=voter)
display(reg1)
```
Die geschätzte Standardabweichung des Achsenabschnitt von Staaten 4.39 und die Standardabweichung von einzelnen 4.19.

InformationsquelleAutor Manoel Galdino

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.