Wie bekomme ich eine einzelne Spalte in der Funke?
Ich würde gerne eine Aktion durchführen, die auf eine einzelne Spalte.
Leider, nachdem ich die Transformation, die Spalte, es ist jetzt nicht mehr Teil der dataframe es kam aber ein Column-Objekt. Als solche, es kann nicht gesammelt werden.
Hier ist ein Beispiel:
df = sqlContext.createDataFrame([Row(array=[1,2,3])])
df['array'].collect()
Diese erzeugt die folgende Fehlermeldung:
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: 'Column' object is not callable
Wie kann ich die collect()
Funktion auf eine einzelne Spalte?
Du musst angemeldet sein, um einen Kommentar abzugeben.
Funke >= 2.0
Ab Spark Version 2.0.0, müssen Sie explizit angeben
.rdd
umflatMap
Funke < 2.0
Nur
select
undflatMap
:Column
ist nur ein SQL-DSL-Ausdruck nicht eine eigenständige Datenstruktur..rdd
jetzt. Einmal war es eingewickelt in. z.B.df.select("array").rdd.flatMap(lambda x: x).collect()