Anwenden von benutzerdefinierten Spalte, um die pandas boxplot?

Bekomme ich eine boxplot Gehalt-Spalte in ein pandas DataFrame...

train.boxplot(column='PredictionError',by='Category',sym='')

...aber ich kann nicht herausfinden, wie definieren Sie den index-Reihenfolge auf die Spalte 'Kategorie' - ich will meine eigenen Auftrag, nach einem anderen Kriterium:

category_order_by_mean_salary = train.groupby('Category')['Salary'].mean().order().keys()

Wie kann ich meine benutzerdefinierte Spalte, um die boxplot Spalten? (andere als hässlich kludging die Spalte Namen mit einem Präfix, um zu erzwingen, Bestellung)

'Kategorie' ist eine string-Spalte unter 27 unterschiedliche Werte: ['Accounting & Finance Jobs','Admin Jobs',...,'Travel Jobs']. So kann es leicht faktorisierten mit pd.Categorical.from_array()

Bei der Prüfung der Verjährung ist innerhalb pandas.tools.plotting.py:boxplot(), wandelt der Spalte Objekt, ohne dass der Bestellung:

Ich glaube, ich könnte entweder hacken bis eine benutzerdefinierte version des pandas boxplot(), oder gelangen in das innere des Objekts. Und auch Datei, die eine Verbesserung verlangen.

EDIT: diese Frage stellte sich mit pandas ~0.13-und hat wahrscheinlich schon überholt ist von neueren (0.19+?) Versionen wie pro @Cireo die späte Antwort.

InformationsquelleAutor smci | 2013-03-21

Schreibe einen Kommentar