Tag: pandas-groupby
Werden für die Gruppierung verwendeten Variablen zusammen, die basierend auf einer bestimmten Bedingung. Und nur verwendet werden, mit Relevanz für die `pandas` Bibliothek
1
Antworten
Habe ich Daten-Frame, der enthält 2 Spalten: Alter und Geschlecht. sex,age 1,30 2,29 1,34 1,27 2,28 2,28 1,40 1,30 1,27 2,31 1,37 1,31 2,28 2,30 2,27 2,27 2,29 2,32 1,28 1,27 1,28 1,28 1,29 1,33 1,32 1,30
2
Antworten
Habe ich Probleme, den übergang zu pandas von R wo dplyr - Paket kann leicht Gruppe durch und führen Sie mehrere Verdichtungen. Bitte helfen Verbesserung meiner bestehenden Python pandas code für mehrere Aggregationen: import pandas as pd
3
Antworten
Wenn ich einen dataframe, die Spalten mit den gleichen Namen, gibt es eine Möglichkeit, verbinden die Spalten, die den gleichen Namen mit einer Art von Funktion (d.h. die Summe)? Beispielsweise mit: In [186]: df["NY-WEB01"].head() Out[186]: NY-WEB01 NY-WEB01
3
Antworten
Ich habe zwei Spalten in mein dataset, col1 und col2. Ich möchte die Gruppe die Daten pro SP1 und dann Sortieren Sie die Daten gemäß der Größe der jeweiligen Gruppe. Das heißt, ich will Anzeigegruppen in aufsteigender
1
Antworten
Angenommen, wir nehmen ein pandas dataframe... name age family 0 john 1 1 1 jason 36 1 2 jane 32 1 3 jack 26 2 4 james 30 2 Dann groupby() ... group_df = df.groupby('family') group_df =
1
Antworten
Ich habe einen DataFrame, der wie folgt aussieht: +----------+---------+-------+ | username | post_id | views | +----------+---------+-------+ | john | 1 | 3 | | john | 2 | 23 | | john | 3 | 44
3
Antworten
Anhand von Beispieldaten: df = pd.DataFrame({'key1' : ['a','a','b','b','a'], 'key2' : ['one', 'two', 'one', 'two', 'one'], 'data1' : np.random.randn(5), 'data2' : np. random.randn(5)}) df data1 data2 key1 key2 0 0.361601 0.375297 a one 1 0.069889 0.809772 a two
1
Antworten
Unten ist mein dataframe. Ich habe einige Transformationen zu erstellen, die die Spalte Kategorie, und ließ die ursprüngliche Spalte es abgeleitet wurde. Jetzt habe ich tun müssen, um eine Gruppe zu entfernen, die dups z.B. Love und
9
Antworten
Habe ich einen Daten-frame mit drei string-Spalten. Ich weiß, dass das nur ein Wert in der 3. Spalte ist, gilt für jede Kombination der ersten beiden. Reinigen Sie die Daten, die ich zu der Gruppe von Daten-Frames
2
Antworten
Ich weiß, das muss beantwortet sein, wo einige, aber ich konnte Sie einfach nicht finden. Problem: Probe jede Gruppe nach groupby-Betrieb. import pandas as pd df = pd.DataFrame({'a': [1,2,3,4,5,6,7], 'b': [1,1,1,0,0,0,0]}) grouped = df.groupby('b') # now sample
3
Antworten
Gegeben der folgende (völlig übertrieben) Daten-frame Beispiel import pandas as pd import datetime as dt df = pd.DataFrame({ "date" : [dt.date(2012, x, 1) for x in range(1, 11)], "returns" : 0.05 * np.random.randn(10), "dummy" : np.repeat(1, 10)
4
Antworten
Sollte einfach sein, aber irgendwie konnte ich nicht finden, eine Lösung, die funktioniert. Habe ich ein pandas dataframe die wie folgt aussieht: index col1 col2 col3 col4 col5 0 a c 1 2 f 1 a c
3
Antworten
Ich habe einen Daten-frame df, die ist wie folgt: | date | Revenue | |----------- | ---------| | 6/2/2017 | 100 | | 5/23/2017 | 200 | | 5/20/2017 | 300 | | 6/22/2017 | 400 |
1
Antworten
Was ist pivot? Wie kann ich pivot? Ist das ein pivot? Lang-format wide format? Ich habe gesehen, eine Menge Fragen, die Sie Fragen, über pivot-Tabellen. Auch wenn Sie nicht wissen, dass Sie Fragen über pivot-Tabellen, Sie sind
1
Antworten
Ich habe einen dataframe sagen, wie diese >>> df = pd.DataFrame({'user_id':['a','a','s','s','s'], 'session':[4,5,4,5,5], 'revenue':[-1,0,1,2,1]}) >>> df revenue session user_id 0 -1 4 a 1 0 5 a 2 1 4 s 3 2 5 s 4 1 5
2
Antworten
Ich habe gehört, in Pandas gibt es oft mehrere Möglichkeiten, das gleiche zu tun, aber ich Frage mich – Wenn ich versuche, Daten gruppieren, indem Sie einen Wert in einer bestimmten Spalte ein und zählen Sie die
1
Antworten
import pandas as pd import numpy as np import matplotlib.pyplot as plt df = pd.read_csv("arrests.csv") df = df.replace(np.nan,0) df = df.groupby(['home_team'])['arrests'].mean() Ich versuche, erstellen Sie ein Balkendiagramm für dataframe. Unter home_team sind eine Reihe von team-Namen. Unter
2
Antworten
Habe ich Folgendes pandas DataFrame: time Group blocks 0 1 A 4 1 2 A 7 2 3 A 12 3 4 A 17 4 5 A 21 5 6 A 26 6 7 A 33 7
1
Antworten
Ich würde gern ein Rang Jahr (also im Jahr 2012, Manager B ist 1. Im Jahr 2011, Manager B: 1 wieder). Ich kämpfte mit den pandas Rang-Funktion für eine Weile und wollen NICHT zu greifen, um eine
4
Antworten
Habe ich Folgendes dataframe: df = pd.DataFrame([ (1, 1, 'term1'), (1, 2, 'term2'), (1, 1, 'term1'), (1, 1, 'term2'), (2, 2, 'term3'), (2, 3, 'term1'), (2, 2, 'term1') ], columns=['id', 'group', 'term']) Möchte ich zu der Gruppe,
3
Antworten
Ich kann nicht herausfinden, den Unterschied zwischen Pandas .aggregate und .apply Funktionen. Nehmen Sie das folgende als Beispiel: ich lade ein dataset, eine groupby definieren Sie eine einfache Funktion, und entweder Benutzer .agg oder .apply. Wie Sie