Wie ein gewichteter least-squares-in r für heteroscedastic Daten?

Ich bin mit einer regression, die auf Daten der Volkszählung, wo meine abhängige variable ist die Lebenserwartung, und ich habe acht unabhängigen Variablen. Die Daten aggregiert werden Städte, so habe ich viele tausend Beobachtungen.

Mein Modell ist etwas heteroscedastic obwohl. Ich möchte zum ausführen einer gewichteten least-squares, wo jede Beobachtung ist gewichtet nach der Bevölkerung der Stadt. In diesem Fall würde es bedeuten, dass ich möchte, zur Gewichtung der Beobachtungen mit dem Kehrwert der Quadratwurzel der Bevölkerung. Es ist mir unklar, jedoch, was wäre die beste syntax. Derzeit habe ich:

Model=lm(,weights=(1/population))

Ist das richtig? Oder sollte es sein:

Model=lm(,weights=(1/sqrt(population)))

(Fand ich diese Frage hier: Weighted-Least-Squares - R aber nicht klären, wie R interpretiert die GEWICHTE argument.)

Wenn Sie wollen, Gewicht zu, indem Sie die inverse der Quadratwurzel der Bevölkerung, was wäre das argument für option 1 option 2?
Ich denke, das ist die Wurzel des Frage - gibt es R interpretieren Sie die GEWICHTE argument weiter?

InformationsquelleAutor Lucas De Abreu Maia | 2013-08-15

Schreibe einen Kommentar