median der pandas dataframe
Ich habe einen DataFrame df
:
name count
aaaa 2000
bbbb 1900
cccc 900
dddd 500
eeee 100
Möchte ich auf die Zeilen, die innerhalb von einem Faktor 10 aus dem Mittelwert der Spalte "count".
Versuchte ich df['count'].median()
und bekam den median. Aber nicht wissen, wie weiter Verfahren wird. Können Sie empfehlen, wie könnte ich mit pandas/numpy.
Erwartete Ausgabe :
name count distance from median
aaaa 2000 *****
Kann jeder Messen wie der Abstand vom median (absolute Abweichung vom median, Quantile etc.).
Was ist Ihre erwartete Ausgabe?
Erwartete Ausgabe wird nun gezeigt, im original-Beitrag
Erwartete Ausgabe wird nun gezeigt, im original-Beitrag
InformationsquelleAutor Ssank | 2015-04-21
Du musst angemeldet sein, um einen Kommentar abzugeben.
Wenn Sie schauen, für wie berechnet sich die Mediane Absolute Abweichung -
InformationsquelleAutor ComputerFellow
Median absolute deviation,
für eine Spalte kann auch berechnet werden,
statsmodels.robust.skalieren.mad
, die kann auch weitergegeben werden, eine Normalisierung Konstantec
in diesem Fall nur 1.InformationsquelleAutor miradulo
Wenn Sie sehen möchten der median, die Sie verwenden können df.beschreiben Sie(). Die 50 - % - Wert ist der median.
InformationsquelleAutor Marjan Alavi