Logistische Regression-Fehler in r

Ich bin momentan dabei, ein Modell mit mehreren tausend Variablen, die alle eine Mehrheit der Werte gleich NA. Ich bin in der Lage, erfolgreich führen Logistische regression auf einige Variablen, andere aber nicht.

Hier ist mein code für die Eingabe der großen Menge von vars:

model_vars <- names(dataset[100:4000])
vars<- paste("DP ~ ", paste(model_vars, collapse= " + "))  

Diese Formate mit den abhängigen Variablen und den einzelnen Unabhängigen Variablen mit einem "+" zwischen. Ich habe dann führen Sie dieses durch die glm-Funktion:

glm(vars, data = training, family = binomial)

Hier ist die Fehlermeldung die ich bekomme, wenn bestimmte Variablen enthalten sind:

Error in family$linkfun(mustart) : 
Argument mu must be a nonempty numeric vector

Ich kann nicht herausfinden, warum dies geschieht und warum die regression funktioniert nach bestimmten Variablen und andere nicht. Ich sehe keinen trend in den Variablen, die den Fehler verursachen. Könnte jemand klären, warum dieser Fehler auftaucht?

Der erste parameter glm() sollte eine Formel. Was genau sind Sie vorbei? reproduzierbare Beispiel wäre hilfreich, um zu diagnostizieren Ihr problem. Ich bin mir nicht sicher, was Sie tun möchten, mit der NA-Werte, aber normalerweise wird jede Zeile mit einem NA-Wert in einer Spalte im Modell enthalten, werden gelöscht.
Original-Frage aktualisiert, mit code für das erzeugen der unabhängigen Variablen Liste. Ich denke r ist der Umgang mit der na-Werte korrekt, da seine arbeitete bereits mit bestimmten vars mit na ' s in Ihnen
Haben Sie versucht, eine Senkung der Anzahl der Variablen auf die minimale Größe, wo Sie repliziert werden können, dieses problem? Idealerweise konnten Sie Holen Sie es auf die Größe, wo man posten könnte es in der Frage und machen dies zu einem reproduzierbaren Beispiel. Auf Stack Overflow Fragen über nicht funktionierenden code sind off-topic und in der Regel geschlossen, es sei denn, Sie verfügen über ein reproduzierbares Beispiel (das wäre in diesem Fall werden code und Daten, die wir verwenden können, um Ihr problem reproduzieren). Lesen Sie mehr über reproduzierbare Beispiele für R Fragen an stackoverflow.com/questions/5963269/...
Danke, werde erstellen Sie eine reproduzierbare Beispiel

InformationsquelleAutor greeny | 2016-02-24

Schreibe einen Kommentar