Auswählen zufällige Elemente aus einer Funke GroupedData Objekt

Ich bin neu in der Verwendung von Spark in Python und nicht in der Lage gewesen, dieses problem zu lösen: Nach dem ausführen groupBy auf eine pyspark.sql.dataframe.DataFrame

df = sqlsc.read.json("data.json")
df.groupBy('teamId')

wie können Sie N Stichproben aus jeder entstehenden Gruppe (gruppiert nach teamId) ohne Ersatz?

Ich bin im Grunde versucht, zu entscheiden N zufällige Benutzer von jedem team, vielleicht mit groupBy ist falsch, mit zu beginnen?

InformationsquelleAutor Nyxynyx | 2015-11-17

Schreibe einen Kommentar