R lineare regression Problem : lm.fit(x, y, offset = offset in der Einzahl.ok = singular.ok, ...)
Ich versuche eine regression mit R.
Ich habe den folgenden code mit kein problem in dem Import der CSV-Datei
dat <- read.csv('http://pastebin.com/raw.php?i=EWsLjKNN',sep=";")
dat # OK Works fine
Regdata <- lm(Y~.,na.action=na.omit, data=dat)
summary(Regdata)
Jedoch, wenn ich versuche eine regression, es funktioniert nicht. Ich bekomme eine Fehlermeldung:
Erreur dans lm.fit(x, y, offset = offset, singular.ok = singular.ok, ...) :
aucun cas ne contient autre chose que des valeurs manquantes (NA)
Alle meine CSV-Datei sind zahlen, und wenn eine "Zelle" leer ist, habe ich die "NA" - Wert. Einige Spalte, die nicht leer sind) und einige andere Zeile, die manchmal leer mit der NA-Wert...
So, ich verstehe nicht, warum bekomme ich eine Fehlermeldung auch mit :
na.action=na.omit
PS:die Daten der CSV sind erhältlich bei:
http://pastebin.com/EWsLjKNN
Möchten Sie vielleicht einen Blick auf Fernen (kostenlos!) Buch: cran.r-project.org/doc/contrib/Faraway-PRA.pdf
vielen Dank, das vorgeschlagene Buch ist genau das, was ich brauchte 😉
vielen Dank, das vorgeschlagene Buch ist genau das, was ich brauchte 😉
InformationsquelleAutor S12000 | 2012-12-19
Du musst angemeldet sein, um einen Kommentar abzugeben.
Erhalten Sie diese Fehlermeldung, da Sie alle Ihre Daten-frame Zeilen enthalten al mindestens einem fehlenden Wert. Es kann überprüft werden, beispielsweise mit diesem code:
So, wenn Sie Sie ausführen regression Witz
lm()
undna.action=na.omit
alle Zeilen des data Frames werden entfernt, und es sind keine Daten zu fit regression.Aber das ist nicht das Hauptproblem. Wenn Ihre zur Verfügung gestellten Daten enthält alle Informationen, die Sie haben, dann sind Sie versucht, gelten die regression mit 165 unabhängigen Variablen (X-Variablen) aus, während nur 22 Beobachtungen. Anzahl der unabhängigen Variablen kleiner sein als die Anzahl der Beobachtungen.
Hallo, danke für die Antworten, wenn ich verstehen, ich muss zwei Bedingungen. Zunächst ist zu haben mehr Zeilen als Spalten. Zweite ist zu erhalten, keine fehlenden Wert. Wenn es einen einzelnen fehlenden Wert das Modell ist nicht gut. Ist es das, was du meinst ?
Sie können einige fehlende Werte und deren Anzahl wird abhängig von der Anzahl der Beobachtungen, die Sie haben. Aber Sie haben zu prüfen, die Anzahl der vollständigen Beobachtungen (Zeilen, die mit keine fehlenden Werte) größer ist als die Anzahl der unabhängigen Variablen (Spalten)
Können Sie erklären, was
apply(data,1,function(x) sum(is.na(x)))
tut bitte? Ich habe keineNA
in meinem Daten-frame, aber " apply(data,1,function(x) sum(is.na(x)))` gab mir6 6 ... 6
es berechnet die Anzahl der fehlenden Werte. Sollte es fehlen einige Werte, wenn Sie bekommen 6
InformationsquelleAutor Didzis Elferts
Ich glaube, ich kann hinzufügen, ein wenig Klarheit, da ich persönlich erlebt, und das ist, warum ich hier bin-außer mein Problem war mit der gls (genearlized least-squares-Modell) vs. standard-linaer-Modell. Manche mögen Logik "könnte" bewerben Sie sich hier-oder in einer situation wie.
Ich nicht widerlegen alles, was jemand gesagt hat, so weit. Möglicherweise gibt es einige Verwirrung mit dem, was die Menschen sehen als eine Beobachtung, und die Art und Weise R percieves diese Dinge.
Sagen, Sie haben 160+ unabhängige Variablen. Sagen, Sie haben einen einzelnen Quelle, in der alle Ihre Daten kommt. Importieren Sie aus einer Datei, Datenbank, etc. Angenommen, Sie haben eine gleiche Menge von response-Variablen oder etwas erfüllt, dass R für Ihre Zwecke der Regressionsanalyse.
R wird Ihnen sagen, dass Sie noch 2 Beobachtungen. Nun, wenn Sie haben, wie Daten, die in der gleichen genauen Art und Weise, aus einer anderen Quelle, Sie haben 3 Beobachtungen wenn man sich in RStudio zu Ihrer Umwelt zu stellen.
Der Grund, warum ich erwähne dies ist, weil der Begriff "Beobachtung" im mathematischen Sinne (als es hier) ist das völlig in Ordnung. In den AGB ' R, Sie auf eine Beobachtung, die sich in mehr als einer Hinsicht.
DAS war ein großer Beitrag zu einem problem, das ich hatte, wie die Art-und Sie sagte mir, ich hatte Werte fehlen, na.dies auslassen, na.Aktion,, etc. Als ich sah auf die OrchardSpray demo, und ich überprüfte meine eigenen Methoden, habe ich es herausgefunden.
Der Punkt ist, dass, wie wir sehen, eine "Beobachtung" in wissen ist eine Sache. R hat einen anderen Begriff dafür, und die Art und Weise es spuckt Fehlermeldungen kann die Ursache für zusätzliche Verwirrung.
Sehen, was ich meine?
InformationsquelleAutor A Noob at R