Anwenden von benutzerdefinierten Spalte, um (auf Kategorische) pandas boxplot?

EDIT: diese Frage stellte sich mit pandas ~0.13-und wurde überholt durch die direkte Unterstützung der irgendwo zwischen version 0.15-0.18 (als pro @Cireo die späte Antwort)


Bekomme ich eine boxplot eines salary-Spalte in ein pandas DataFrame...

train.boxplot(column='Salary', by='Category', sym='')

...aber ich kann nicht herausfinden, wie definieren Sie den index-Reihenfolge auf die Spalte 'Kategorie' - ich will meine eigenen Auftrag, nach einem anderen Kriterium:

category_order_by_mean_salary = train.groupby('Category')['Salary'].mean().order().keys()

Wie kann ich meine benutzerdefinierte Spalte, um die boxplot Spalten? (andere als hässlich kludging die Spalte Namen mit einem Präfix, um zu erzwingen, Bestellung)

'Kategorie' ist ein string (wirklich, sollte eine kategorische, aber dies war in den 0.13, wo kategorischen war ein Dritte-Klasse-Bürger) - Spalte unter 27 unterschiedliche Werte: ['Accounting & Finance Jobs','Admin Jobs',...,'Travel Jobs']. So kann es leicht faktorisierten mit pd.Categorical.from_array()

Bei der Prüfung der Verjährung ist innerhalb pandas.tools.plotting.py:boxplot(), wandelt der Spalte Objekt, ohne dass der Bestellung:

Ich glaube, ich könnte entweder hacken bis eine benutzerdefinierte version des pandas boxplot(), oder gelangen in das innere des Objekts. Und auch Datei, die eine Verbesserung verlangen.

InformationsquelleAutor smci | 2013-03-21
Schreibe einen Kommentar