Plotten Sie die Ergebnisse der Pandas GroupBy

Bin ich angefangen zu lernen, Pandas und bin auf der Suche nach den meisten Pythonic (oder panda-thonic?) Möglichkeiten, das zu tun, bestimmte Aufgaben.

Nehmen wir an, wir haben einen DataFrame mit den Spalten A, B und C.

  • Spalte A enthält den booleschen Werte ist: jede Zeile ist Ein Wert, der entweder true oder false.
  • Spalte B hat einige wichtige Werte, die wir zeichnen möchten.

Was wir entdecken wollen ist, die subtilen Unterscheidungen zwischen B-Werte für Zeilen mit Einer auf false gesetzt, vs. B-Werte für die Zeilen, A ist wahr.

In anderen Worten, wie kann ich die Gruppe durch den Wert der Spalte (entweder true oder false), dann zeichnen die Werte von Spalte B für die beiden Gruppen auf dem gleichen Graphen? Die beiden Datensätze sollen unterschiedlich eingefärbt werden, um in der Lage zu unterscheiden, die Punkte.


Als Nächstes fügen wir eine weitere Funktion, die dieses Programm: vor der Grafik wollen wir berechnen einen anderen Wert für jede Zeile und speichern Sie es in Spalte D. Dieser Wert ist der Mittelwert aller gespeicherten Daten B für die gesamten fünf Minuten, bevor ein Datensatz -, aber wir sind nur Zeilen, die den gleichen booleschen Wert gespeichert in A.

In anderen Worten, wenn ich eine Zeile, wo A=True und time=t ich berechnen möchten Sie einen Wert für die Spalte D ist der Mittelwert von B für alle Datensätze aus der Zeit t-5 zu t haben die gleichen A=True.

In diesem Fall, wie können wir führen Sie die groupby auf die Werte von A, dann gilt diese Berechnung für jede einzelne Gruppe, und endlich zeichnen Sie die D-Werte für die beiden Gruppen?

InformationsquelleAutor der Frage Maxim Zaslavsky | 2013-03-17

Schreibe einen Kommentar