Logistische regression - cbind-Befehl in glm
Ich mache Logistische regression in R. Kann jemand klären, was die Unterschiede der Ausführung dieser beiden Zeilen?
1. glm(Response ~ Temperature, data=temp,
family = binomial(link="logit"))
2. glm(cbind(Response, n - Response) ~ Temperature,
data=temp, family =binomial, Ntrials=n)
Den Daten sieht wie folgt aus:
(Hinweis : die Antwort ist binären. 0=Würfel 1=Nicht sterben)
Response Temperature
0 24.61
1 39.61
1 39.50
0 22.71
0 21.61
1 39.70
1 36.73
1 33.32
0 21.73
1 49.61
- Paul...die erste Zeile ist einfach zu verstehen. :). Ich habe versucht, herauszufinden, die zweite, weil Sie einige Beispiele in R verwendet es. UND..diese zwei erzeugt anderes Ergebnis. 🙂
- ist richtig, glaube ich. Wenn
n
1 ist, dann sollten Sie genau die gleiche Antwort in diesem Fall. Im Allgemeinen sollten Sie die Verwendung der zweiten form, wenn Sie mehr als einen Test pro Beobachtung. DieNtrials
argument ist falsch/unnötig ist, soweit ich das sagen kann. - Ich danke dir sehr, Ben. Können Sie erläutern weiter, was meinst du mit "mehr als einem Versuch der pr-Beobachtung" bitte? :)-
- Angenommen, Ihre Daten werden gruppiert, so dass Sie gemessen hatte mehrere Individuen (z.B. 10) bei jeder Temperatur Wert; Sie dann vielleicht 7 von 10 überlebenden auf temp 22.71, so Ihre Einschätzung basiert auf einer binomial-Ergebnis von 7 überlebenden mit der Wahrscheinlichkeit p in N=10 versuchen. Normalerweise, wenn Menschen sagen, dass "Logistische regression" Sie bedeuten ungruppierten Daten (
N=1
), die Reservierung von "binomial regression" für die Gruppen-Fall, aber die Bedingungen sind etwas austauschbar, ...
Du musst angemeldet sein, um einen Kommentar abzugeben.
Wenn du die binomial-oder quasibinomial
glm
Sie entweder auf Lieferung einer Wahrscheinlichkeit von Erfolg, ein zwei-Säulen-matrix mit den Spalten geben die zahlen der Erfolge und Misserfolge, oder ein Faktor, wo die erste Ebene kennzeichnet scheitern und andere Erfolg auf der linken Seite der Gleichung. Details finden Sie in der?glm
.weights
argument. Es würde wie folgt Aussehen:glm(events/n ~ x, data=*, weights=n, ...)