Pyspark 'PipelinedRDD' - Objekt hat kein Attribut 'show'

Ich
Ich möchte herausfinden, was alle Elemente in x, die nicht in df1 , auch Elemente in df1, aber nicht in der df

    df =sc.parallelize([1,2,3,4 ,5 ,6,7,8,9])
    df1=sc.parallelize([4 ,5 ,6,7,8,9,10])
    df2 = df.subtract(df1)
    df2.show()
    df3 = df1.subtract(df)
    df3.show()

Nur wollen, um das Ergebnis überprüfen, um zu sehen, wenn ich verstehen, die gut funktionieren.
Aber habe diesen Fehler
'PipelinedRDD' - Objekt hat kein Attribut 'show'
jede Anregung?

InformationsquelleAutor newleaf | 2016-12-15

Schreibe einen Kommentar