Wie man ein Balkendiagramm mit nicht-numerischen Daten in pandas

Glaube, ich hatte diese Daten:

>>> df = pd.DataFrame(data={"age": [11, 12, 11, 11, 13, 11, 12, 11],
                        "response": ["Yes", "No", "Yes", "Yes", "Yes", "No", "Yes", "Yes"]})
>>> df
    age response
0   11  Yes
1   12  No
2   11  Yes
3   11  Yes
4   13  Yes
5   11  No
6   12  Yes
7   11  Yes

Ich würde gerne ein Balkendiagramm, das zeigt, die mit ja oder Nein Antworten aggregiert nach Alter. Wäre es überhaupt möglich? Ich habe versucht hist und kind=bar, aber keiner war in der Lage zu Sortieren, die durch Alter, stattdessen grafische Darstellung Alter und Reaktion getrennt.

Würde es so Aussehen:

  ^
4 |   o
3 |   o
2 |   o
1 |   ox      ox      o
0 .----------------------->
      11      12      13

wo o "ja", und x ist "Nein".

Außerdem wäre es möglich, die zahlen gruppiert? Wenn Sie hatte eine Reichweite von 11 bis 50, zum Beispiel, Sie könnten in der Lage sein, um es in 5-Jahres-bins. Auch wäre es möglich zu zeigen, Prozentsätze oder zählt auf der Achse oder auf die individuellen bar?

Mit df.Grundstück(Art='bar') würde Ihnen Antworten, dass hatte (11,No), (11,ja),(12,Nein) und so weiter.
df.plot(kind='bar'), ohne etwas zu tun, plots, bar-plot der index mit y das Alter.

InformationsquelleAutor Jean Nassar | 2015-12-13

6

Zu bin Ihre Daten, nehmen Sie einen Blick auf pandas.cut() siehe docs. Für kategoriale plots, die ich gefunden habe, die seaborns - Paket ganz hilfreich - siehe das tutorial auf kategoriale plots. Unten ein Beispiel für eine grafische Darstellung der ja/Nein-zählt für die Behälter, die Sie erwähnen, anhand einer zufälligen Stichprobe:
```
df = pd.DataFrame(data={"age": randint(10, 50, 1000),
                    "response": [choice(['Yes', 'No']) for i in range(1000)]})

df['age_group'] = pd.cut(df.age, bins=[g for g in range(10, 51, 5)], include_lowest=True)
df.head()

   age response age_group
0   48      Yes  (45, 50]
1   31       No  (30, 35]
2   25      Yes  (20, 25]
3   29      Yes  (25, 30]
4   19      Yes  (15, 20]

import seaborn as sns
sns.countplot(y='response', hue='age_group', data=df, palette="Greens_d")
```
- Dies ist erstaunlich,. Danke. Ich verwendet sns.countplot(x='age_group', hue='response', data=df.sort("response"), palette="Greens_d").
- Auch der name des Pakets war seaborn, nicht seaborns.
- Tippfehler behoben. Sieht aus wie diese Adressen sowohl binning und Blumenerde Aspekte Ihrer Frage.
- Tut es, ja. Ich pflegte Ihnen so die akzeptierte Antwort.
InformationsquelleAutor Stefan
9

Generieren ein Vielfaches bar plot, würden Sie die erste Gruppe nach Alter und Reaktion und dann unstack der dataframe:
```
df=df.groupby(['age','response']).size()
df=df.unstack()
df.plot(kind='bar')
```
Hier ist die Ausgabe plot:
- Ich bekomme eine TypeError: Empty 'DataFrame': no numeric data to plot. Jedoch, df selbst ist nicht leer.
- Es funktioniert! Danke! Sie brauchen nur zu addieren df = vor der df.groupby. Auch ich wurde FutureWarning: elementwise comparison failed; returning scalar instead, but in the future will perform elementwise comparison return np.sum(name == np.asarray(self.names)) > 1. Aber das ist ein Pandabären-Betrieb. Sollte ich Einreichen, ein Problem, oder ist es etwas, das ich tun kann, dass mich?
- Sieht aus wie Sie mit einer älteren release von Pandas, nichts zu befürchten, es ist fest in den bevorstehenden release.
InformationsquelleAutor Learner

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.