Schrittweise Regression in Python
Wie durchführen schrittweise regression in python? Es gibt Methoden für die OLS in SCIPY, aber ich bin nicht in der Lage, das zu tun schrittweise. Jede Hilfe in dieser Hinsicht wäre eine große Hilfe. Danke.
Edit: ich versuche zu bauen, ein lineares Regressionsmodell. Ich habe 5 unabhängigen Variablen und mit Hilfe der vorwärts schrittweise regression, ich-Ziel wählen Sie Variablen so, dass mein Modell hat den niedrigsten p-Wert. Folgender link erklärt das Ziel:
Nochmals vielen Dank.
InformationsquelleAutor der Frage user2174063 | 2013-03-15
Du musst angemeldet sein, um einen Kommentar abzugeben.
Trevor Smith und ich schrieb ein wenig vorwärts Auswahl-Funktion für die lineare regression mit statsmodels: http://planspace.org/20150423-forward_selection_with_statsmodels/ könnten Sie leicht ändern Sie es zu minimieren, ein p-Wert, oder wählen Sie basierend auf beta p-Werte mit nur ein wenig mehr Arbeit.
InformationsquelleAutor der Antwort Aaron Schumacher
Statsmodels hat zusätzliche Methoden für regression: http://statsmodels.sourceforge.net/devel/examples/generated/example_ols.html. Ich denke, es hilft Ihnen bei der Umsetzung schrittweise regression.
InformationsquelleAutor der Antwort Matti Pastell
Können Sie machen vorwärts-rückwärts-Auswahl, basierend auf
statsmodels.api.OLS
- Modell, wie abgebildet in dieser Antwort.Jedoch diese Antwort beschreibt, warum sollten Sie nicht verwenden die schrittweise Auswahl für ökonometrische Modelle in den ersten Platz.
InformationsquelleAutor der Antwort David Dale
Über die Zusammenfassung Methode, können Sie in Ihrem kernel die p-Werte der
Variablen geschrieben, wie " P>|t|'. Dann überprüfen Sie für die variable mit dem höchsten p
Wert. Angenommen x3 hat den höchsten Wert von e ist.g 0.956. Entfernen Sie dann diese Spalte
aus deinem array und wiederholen Sie alle Schritte.
Wiederholen Sie diese Methoden, bis Sie entfernen Sie alle Spalten, die p-Wert größer als das Signifikanz-Wert(e.g 0.05). Am Ende Ihrer Variablen X_opt haben alle die optimalen Variablen mit p-Werten kleiner als Signifikanzniveau.
InformationsquelleAutor der Antwort Varun-08