PySpark - Split/Filter DataFrame Spalte Werte

Ich habe einen DataFrame ähnlich wie in diesem Beispiel:

Timestamp | Word | Count

30/12/2015 | example_1 | 3

29/12/2015 | example_2 | 1

28/12/2015 | example_2 | 9

27/12/2015 | example_3 | 7

... | ... | ...

und ich teilen möchten, auf das Daten-frame von 'word' - Spalte Werte zu erhalten, eine "Liste" von DataFrame (zeichnen einiger Figuren in einem nächsten Schritt). Zum Beispiel:

DF1

Timestamp | Word | Count

30/12/2015 | example_1 | 3

DF2

Timestamp | Word | Count

29/12/2015 | example_2 | 1

28/12/2015 | example_2 | 9

DF3

Timestamp | Word | Count

27/12/2015 | example_3 | 7

Gibt es eine Möglichkeit, dies zu tun mit PySpark (1.6)?

InformationsquelleAutor | 2016-02-03
Schreibe einen Kommentar