Wie zu verwenden Ausreißer-Tests in R-Code
Als Teil meiner Daten, workflow-Analyse, möchte ich zu test für Ausreißer, und dann tun meine weitere Berechnung mit und ohne die Ausreißer.
Ich habe festgestellt, das Ausreißer-Paket, das verschiedene tests, aber ich bin mir nicht sicher, wie Sie Sie am besten verwenden Sie für meinen workflow.
InformationsquelleAutor der Frage PaulHurleyuk | 2009-09-18
Du musst angemeldet sein, um einen Kommentar abzugeben.
Wenn Sie sind besorgt über Ausreißer, stattdessen werfen Sie aus, verwenden Sie eine robuste Methode. Zum Beispiel, anstelle von lm verwenden rlm.
InformationsquelleAutor der Antwort hadley
Stimme ich Dirk, Es ist schwer. Ich würde empfehlen, den ersten Blick auf, warum Sie möglicherweise haben Ausreißer. Ein Ausreißer ist nur eine Zahl, dass jemand denkt, ist verdächtig, es ist kein konkretes "schlechte" Wert, und wenn Sie nicht finden können ein Grund dafür sein, ein Ausreisser, können Sie Leben mit der Unsicherheit.
Eine Sache, die Sie nicht erwähnte, war, welche Art von Ausreißer, die Sie suchen. Sind Ihre Daten rund um eine meine, haben Sie eine Besondere Verteilung oder gibt es da eine Beziehung zwischen Ihren Daten.
Hier einige Beispiele
Zunächst erstellen wir einige Daten, und dann verderben Sie es mit einem Ausreißer;
Ist es Häufig sinnvoll, zu prüfen, die Daten grafisch dar (Sie sind Gehirn sehr viel besser im entdecken von Ausreißern als die Mathematik)
Dann können Sie einen test. Wenn der test gibt einen cut-off-Wert, oder den Wert, der vielleicht ein Ausreisser, die Sie verwenden können, ifelse, um es zu entfernen
Oder für kompliziertere Beispiele, die Sie verwenden können, Statistiken zu berechnen, die den kritischen cut-off-Werte, hier mit Hilfe der Lund-Test (Siehe Lund, R. E. 1975, "Tabellen für die Ungefähren Test für Ausreißer in Linearen Modellen", Technometrics, vol. 17, no. 4, S. 473-476. und Prescott, P. 1975, "Eine Ungefähre Test für Ausreißer in Linearen Modellen", Technometrics, vol. 17, no. 1, S. 129-132.)
Edit: ich habe gerade bemerkt ein Problem in meinem code. Der Lund-test ein Kritischer Wert, der verglichen werden sollte, um den absoluten Wert der studantized Restwert (D. H. ohne Vorzeichen)
InformationsquelleAutor der Antwort PaulHurleyuk
"Es ist schwer". Vieles davon ist Kontext-abhängig und Sie können einbetten dieser in Ihrer Anwendung:
Andere als die Ausreißer-Pakete gibt es auch die qcc - Paket, wie die Qualitätskontrolle der Literatur umfasst dieser Bereich.
Gibt es viele andere Bereiche, die Sie sehen könnten, wie z.B. die robuste Statistiken Task View.
InformationsquelleAutor der Antwort Dirk Eddelbuettel
Versuchen die
outliers::score
Funktion. Ich weiß nicht raten, das entfernen der sogenannten Ausreißer, aber zu wissen, Ihre extreme Beobachtungen ist gut.Finden Sie weitere Hilfe mit Ausreißer-Erkennung hier
InformationsquelleAutor der Antwort Selva