Wie join über mehrere Spalten in Pyspark?

Bin ich mit Spark 1.3 und würde gerne mitmachen auf mehreren Spalten über die python-Schnittstelle (SparkSQL)

Folgende Werke:

Ich zunächst registrieren Sie als temporäre Tabellen.

numeric.registerTempTable("numeric")
Ref.registerTempTable("Ref")

test  = numeric.join(Ref, numeric.ID == Ref.ID, joinType='inner')

Ich würde nun gerne beitreten Sie basiert auf mehreren Säulen.

Bekomme ich SyntaxError: ungültige syntax mit dieser:

test  = numeric.join(Ref,
   numeric.ID == Ref.ID AND numeric.TYPE == Ref.TYPE AND
   numeric.STATUS == Ref.STATUS ,  joinType='inner')
InformationsquelleAutor user3803714 | 2015-11-16
Schreibe einen Kommentar