Pyspark 'PipelinedRDD' - Objekt hat kein Attribut 'show'
Ich
Ich möchte herausfinden, was alle Elemente in x, die nicht in df1 , auch Elemente in df1, aber nicht in der df
df =sc.parallelize([1,2,3,4 ,5 ,6,7,8,9])
df1=sc.parallelize([4 ,5 ,6,7,8,9,10])
df2 = df.subtract(df1)
df2.show()
df3 = df1.subtract(df)
df3.show()
Nur wollen, um das Ergebnis überprüfen, um zu sehen, wenn ich verstehen, die gut funktionieren.
Aber habe diesen Fehler
'PipelinedRDD' - Objekt hat kein Attribut 'show'
jede Anregung?
InformationsquelleAutor newleaf | 2016-12-15
Du musst angemeldet sein, um einen Kommentar abzugeben.
df.show()
ist nur für spark-DataFrameInformationsquelleAutor Zhang Tong
Konvertieren Sie eine rdd zu Funken dataframe mit createDataFrame
InformationsquelleAutor leo