Erkennen und ausschließen von Ausreißern in der Pandas-Daten-frame

Habe ich ein pandas dataframe mit wenigen Spalten.

Jetzt weiß ich, dass gewisse Zeilen sind-Ausreißer, basierend auf einer bestimmten Spalte Wert.

Beispielsweise Spalten - 'Vol' hat alle Werte um 12xx und ein Wert 4000 (Ausreißer).

Nun würde ich gerne ausschließen, die Zeilen, die 'Vol' - Spalte wie diese.
Also, im Grunde brauche ich einen filter auf die Daten-Frames so, dass wir wählen Sie alle Zeilen aus, in denen die Werte einer bestimmten Spalte sind innerhalb von sagen wir 3 Standardabweichungen vom Mittelwert.

Was ist ein eleganter Weg, dies zu erreichen.

InformationsquelleAutor AMM | 2014-04-21
Schreibe einen Kommentar