Tag: pandas-groupby

Werden für die Gruppierung verwendeten Variablen zusammen, die basierend auf einer bestimmten Bedingung. Und nur verwendet werden, mit Relevanz für die `pandas` Bibliothek

Wie plot-Alter-Verteilung mit pandas

Anzahl der Antworten 1 Antworten
Habe ich Daten-Frame, der enthält 2 Spalten: Alter und Geschlecht. sex,age 1,30 2,29 1,34 1,27 2,28 2,28 1,40 1,30 1,27 2,31 1,37 1,31 2,28 2,30 2,27 2,27 2,29 2,32 1,28 1,27 1,28 1,28 1,29 1,33 1,32 1,30

Was ist der pandas äquivalent von dplyr zusammenfassen/aggregieren von mehreren Funktionen?

Anzahl der Antworten 2 Antworten
Habe ich Probleme, den übergang zu pandas von R wo dplyr - Paket kann leicht Gruppe durch und führen Sie mehrere Verdichtungen. Bitte helfen Verbesserung meiner bestehenden Python pandas code für mehrere Aggregationen: import pandas as pd

Kombinieren duplizierten Spalten innerhalb einer DataFrame

Anzahl der Antworten 3 Antworten
Wenn ich einen dataframe, die Spalten mit den gleichen Namen, gibt es eine Möglichkeit, verbinden die Spalten, die den gleichen Namen mit einer Art von Funktion (d.h. die Summe)? Beispielsweise mit: In [186]: df["NY-WEB01"].head() Out[186]: NY-WEB01 NY-WEB01

Sortierung der gruppierten Daten pro Gruppe Größe in Pandas

Anzahl der Antworten 3 Antworten
Ich habe zwei Spalten in mein dataset, col1 und col2. Ich möchte die Gruppe die Daten pro SP1 und dann Sortieren Sie die Daten gemäß der Größe der jeweiligen Gruppe. Das heißt, ich will Anzeigegruppen in aufsteigender

Gibt es eine "Gruppierung aufheben by" Betrieb gegenüber .groupby in pandas?

Anzahl der Antworten 1 Antworten
Angenommen, wir nehmen ein pandas dataframe... name age family 0 john 1 1 1 jason 36 1 2 jane 32 1 3 jack 26 2 4 james 30 2 Dann groupby() ... group_df = df.groupby('family') group_df =

Pandas groupby mit bin zählt

Anzahl der Antworten 1 Antworten
Ich habe einen DataFrame, der wie folgt aussieht: +----------+---------+-------+ | username | post_id | views | +----------+---------+-------+ | john | 1 | 3 | | john | 2 | 23 | | john | 3 | 44

Python Pandas Bedingte Summe mit Groupby

Anzahl der Antworten 3 Antworten
Anhand von Beispieldaten: df = pd.DataFrame({'key1' : ['a','a','b','b','a'], 'key2' : ['one', 'two', 'one', 'two', 'one'], 'data1' : np.random.randn(5), 'data2' : np. random.randn(5)}) df data1 data2 key1 key2 0 0.361601 0.375297 a one 1 0.069889 0.809772 a two

Wie der Gruppe, indem Sie auf ein multiindex in pandas?

Anzahl der Antworten 1 Antworten
Unten ist mein dataframe. Ich habe einige Transformationen zu erstellen, die die Spalte Kategorie, und ließ die ursprüngliche Spalte es abgeleitet wurde. Jetzt habe ich tun müssen, um eine Gruppe zu entfernen, die dups z.B. Love und

GroupBy pandas DataFrame, und wählen Sie die meisten gemeinsamen Wert

Anzahl der Antworten 9 Antworten
Habe ich einen Daten-frame mit drei string-Spalten. Ich weiß, dass das nur ein Wert in der 3. Spalte ist, gilt für jede Kombination der ersten beiden. Reinigen Sie die Daten, die ich zu der Gruppe von Daten-Frames

Probe jede Gruppe nach pandas groupby

Anzahl der Antworten 2 Antworten
Ich weiß, das muss beantwortet sein, wo einige, aber ich konnte Sie einfach nicht finden. Problem: Probe jede Gruppe nach groupby-Betrieb. import pandas as pd df = pd.DataFrame({'a': [1,2,3,4,5,6,7], 'b': [1,1,1,0,0,0,0]}) grouped = df.groupby('b') # now sample

Mehrere Aggregationen der gleichen Spalte mit pandas GroupBy.agg()

Anzahl der Antworten 3 Antworten
Gegeben der folgende (völlig übertrieben) Daten-frame Beispiel import pandas as pd import datetime as dt df = pd.DataFrame({ "date" : [dt.date(2012, x, 1) for x in range(1, 11)], "returns" : 0.05 * np.random.randn(10), "dummy" : np.repeat(1, 10)

Pandas - dataframe groupby -, wie man die Summe von mehreren Spalten

Anzahl der Antworten 4 Antworten
Sollte einfach sein, aber irgendwie konnte ich nicht finden, eine Lösung, die funktioniert. Habe ich ein pandas dataframe die wie folgt aussieht: index col1 col2 col3 col4 col5 0 a c 1 2 f 1 a c

Wie kann ich Group By Monat, aus einem Datumsfeld mit Python/Pandas

Anzahl der Antworten 3 Antworten
Ich habe einen Daten-frame df, die ist wie folgt: | date | Revenue | |----------- | ---------| | 6/2/2017 | 100 | | 5/23/2017 | 200 | | 5/20/2017 | 300 | | 6/22/2017 | 400 |

Wie man eine pivot-dataframe

Anzahl der Antworten 1 Antworten
Was ist pivot? Wie kann ich pivot? Ist das ein pivot? Lang-format wide format? Ich habe gesehen, eine Menge Fragen, die Sie Fragen, über pivot-Tabellen. Auch wenn Sie nicht wissen, dass Sie Fragen über pivot-Tabellen, Sie sind

Pandas, groupby und count

Anzahl der Antworten 1 Antworten
Ich habe einen dataframe sagen, wie diese >>> df = pd.DataFrame({'user_id':['a','a','s','s','s'], 'session':[4,5,4,5,5], 'revenue':[-1,0,1,2,1]}) >>> df revenue session user_id 0 -1 4 a 1 0 5 a 2 1 4 s 3 2 5 s 4 1 5

Wann ist es angebracht, df.value_counts() vs df.groupby('...').count()?

Anzahl der Antworten 2 Antworten
Ich habe gehört, in Pandas gibt es oft mehrere Möglichkeiten, das gleiche zu tun, aber ich Frage mich – Wenn ich versuche, Daten gruppieren, indem Sie einen Wert in einer bestimmten Spalte ein und zählen Sie die

Bar graph von dataframe groupby

Anzahl der Antworten 1 Antworten
import pandas as pd import numpy as np import matplotlib.pyplot as plt df = pd.read_csv("arrests.csv") df = df.replace(np.nan,0) df = df.groupby(['home_team'])['arrests'].mean() Ich versuche, erstellen Sie ein Balkendiagramm für dataframe. Unter home_team sind eine Reihe von team-Namen. Unter

Pandas: plot multiple time series DataFrame in einen einzigen plot

Anzahl der Antworten 2 Antworten
Habe ich Folgendes pandas DataFrame: time Group blocks 0 1 A 4 1 2 A 7 2 3 A 12 3 4 A 17 4 5 A 21 5 6 A 26 6 7 A 33 7

pandas group by Jahr, Rang nach Umsatz-Spalte, in einen dataframe mit doppelten Daten

Anzahl der Antworten 1 Antworten
Ich würde gern ein Rang Jahr (also im Jahr 2012, Manager B ist 1. Im Jahr 2011, Manager B: 1 wieder). Ich kämpfte mit den pandas Rang-Funktion für eine Weile und wollen NICHT zu greifen, um eine

Groupby-Wert zählt zu den pandas dataframe

Anzahl der Antworten 4 Antworten
Habe ich Folgendes dataframe: df = pd.DataFrame([ (1, 1, 'term1'), (1, 2, 'term2'), (1, 1, 'term1'), (1, 1, 'term2'), (2, 2, 'term3'), (2, 3, 'term1'), (2, 2, 'term1') ], columns=['id', 'group', 'term']) Möchte ich zu der Gruppe,

Was ist der Unterschied zwischen pandas agg gelten-Funktion?

Anzahl der Antworten 3 Antworten
Ich kann nicht herausfinden, den Unterschied zwischen Pandas .aggregate und .apply Funktionen. Nehmen Sie das folgende als Beispiel: ich lade ein dataset, eine groupby definieren Sie eine einfache Funktion, und entweder Benutzer .agg oder .apply. Wie Sie