Wie kann ich identifizieren die Etiketten von Ausreißern in R boxplot?
R boxplot-Funktion ist eine sehr nützliche Betrachtungsweise der Daten: es ist schnell, bietet eine visuelle Zusammenfassung der ungefähren Lage und Varianz der Daten, und die Anzahl der Ausreißer. Darüber hinaus möchte ich zu identifizieren, die Ausreißer, um schnell zu finden, Probleme, die in das dataset.
Sich die Werte der "Ausreißer" kann zugegriffen werden mit myplot$out
. Leider, die Etiketten diese Ausreißer scheinen nicht verfügbar zu sein. Es gibt einige Pakete, die gezielt auf die Anzeige der Etiketten auf die Handlung selbst: http://www.r-statistics.com/2011/01/how-to-label-all-the-outliers-in-a-boxplot/, aber Sie funktionieren nicht gut, und ich möchte nur diese Ausreißer, die ich nicht brauchen, Sie werden auf dem Grundstück selbst.
Irgendwelche Ideen?
InformationsquelleAutor static_rtti | 2012-06-21
Du musst angemeldet sein, um einen Kommentar abzugeben.
Hast du gemacht, die meisten von der harten Arbeit selbst. Alle, die noch ein Vergleich:
Greifen die Ausreißer
Extrahieren Sie die Ausreißer aus der original-Daten-frame
Weitere Erklärung:
Die variable
dd$x
ist der Vektor der 26 Nummern. Die variableoutliers
enthält die Werte der "Ausreißer" (nur Typdd$x
undoutliers
im R-Konsole). Der Befehlentspricht, die Werte von dd$x und Ausreißer, nämlich:
Die eckige Klammer notation
dd[dd$x %in% outliers,]
gibt die Zeilen des data Framesdd
, wodd$x %in% outliers
zurückTRUE
.InformationsquelleAutor csgillespie
Schlage ich vor
which(x < myplot$stats[1] | x > myplot$stats[5])
wobei x für deine Daten.InformationsquelleAutor danas.zuokas
Wenn der eingegeben Daten ist ein Vektor mit benannten Elementen, boxplot, bleiben die Namen.
InformationsquelleAutor plannapus