Python Pandas GroupBy-Holen Sie sich eine Liste der Gruppen

Ich habe eine code-Zeile:

g = x.groupby('Color')

Den Farben Rot, Blau, Grün, Gelb, Lila, Orange und Schwarz. Wie gebe ich diese Liste? Für ähnliche Attribute, die ich x verwenden.Attribut und es funktioniert gut, aber x.Farbe nicht die gleiche Weise Verhalten.

Du willst also eine Liste der eindeutigen Werte in der Farbe?
Sie können die eindeutigen Werte aus dem orig df, keine Notwendigkeit, Gruppe x['Color'].unique()
Der x['Farbe'].einzigartige ended up being genau das, was ich suchte. Danke.

InformationsquelleAutor user3745115 | 2015-03-04

pandas python

40

Es ist viel einfacher Weg, es zu tun:
```
g = x.groupby('Color')

g.groups.keys()
```
By doing groupby() pandas gibt Sie einen dict-gruppierte DFs.
Sie können leicht Holen Sie sich die key-Liste dieses dict von python eingebaute Funktion keys().
- Das ist viel mehr pandorable als andere Antworten. 🙂
- Bitte schauen Sie sich bei Erik Swan ' s Antwort unten, bevor Sie eine Entscheidung treffen, auf welche Methode Sie verwenden. Wenn konsistente Reihenfolge der Gruppennamen ist ein Problem, gehen Sie für Erik in den Weg.
- groupby() nicht wieder eine dict, aber ein DataFrameGroupBy Objekt.
InformationsquelleAutor Yanqi Ma
15

Wenn Sie kümmern sich nicht um die Reihenfolge der Gruppen, Yanqi Ma die Antwort wird funktionieren:
```
g = x.groupby('Color')
g.groups.keys()
list(g.groups) # or this
```
Beachten Sie jedoch, dass g.groups ist ein Wörterbuch, so die Schlüssel sind grundsätzlich ungeordnet! Dies ist auch dann der Fall, wenn Sie sort=True auf die groupby Methode zum Sortieren der Gruppen, die standardmäßig true ist.

Diese tatsächlich mich etwas schwer, wenn es führte zu einer anderen, um auf zwei Plattformen, vor allem, da ich mit list(g.groups), so war es nicht offensichtlich, dass g.groups war ein dict.

Meiner Meinung nach, der beste Weg, dies zu tun ist, um die Vorteile der Tatsache, dass die GroupBy-Objekt einen iterator, und verwenden Sie eine list-comprehension Rückkehr der Gruppen in der Reihenfolge, wie Sie existieren in den GroupBy-Objekt:
```
g = x.groupby('Color')
groups = [name for name,unused_df in g]
```
Es ist ein bisschen weniger lesbar, aber dieser wird immer wieder die Gruppen in der richtigen Reihenfolge.

InformationsquelleAutor Erik Swan
3

Es ist mein Verständnis, dass Sie einen Daten-Frame enthält ein Vielfaches Spalten. Eine der Spalten ist "Farbe", die verschiedene Arten von Farben. Sie wollen, um eine Liste der einzigartigen Farben, die es gibt.
```
colorGroups = df.groupby(['Color'])
for c in colorGroups.groups: 
    print c
```
Den oben angegebenen code der Ihnen alle Farben, die existieren, ohne die Wiederholung der Farben-Namen. Also, sollten Sie eine Ausgabe wie:
```
Red
Blue
Green
Yellow
Purple
Orange
Black
```
Alternative ist die unique() Funktion gibt ein array zurück, der alle eindeutigen Werte in einer Reihe. Somit erhalten Sie ein array von einzigartigen Farben, die Sie würden tun:
```
df['Color'].unique()
```
Die Ausgabe ist ein array, so zum Beispiel print df['Color'].unique()[3] würde Ihnen Yellow.

InformationsquelleAutor Zythyr
2

Hier ist, wie es zu tun.
```
groups = list()
for g, data in x.groupby('Color'):
    print(g, data)
    groups.append(g)
```
Die Kern-Idee ist diese hier: wenn Sie Durchlaufen ein dataframe groupby-iterator, Sie zurück zu bekommen ein zwei-Tupel von (name der Gruppe, gefilterte Daten-frame), wo die gefilterten Daten-frame enthält nur die Datensätze der entsprechenden Gruppe).
- Alternativ, wenn Sie möchten, um die eindeutigen Werte in jeder Spalte, die Sie tun können numpy.unique(x[col_name].values)
InformationsquelleAutor ericmjl

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.