Spark gibt mehrere Spaltenbedingungen für den Datenrahmen-Join an

Geben wie die Spalte Bedingungen bei der Teilnahme an zwei dataframes. Zum Beispiel möchte ich Folgendes ausführen :

val Lead_all = Leads.join(Utm_Master,  
    Leaddetails.columns("LeadSource","Utm_Source","Utm_Medium","Utm_Campaign") ==
    Utm_Master.columns("LeadSource","Utm_Source","Utm_Medium","Utm_Campaign"),
"left")

Will ich erst beitreten, wenn diese Spalten übereinstimmen. Aber oben-syntax ist nicht gültig, da cols dauert nur eine Zeichenfolge. So, wie bekomme ich, was ich will.

InformationsquelleAutor der Frage user568109 | 2015-07-06

Schreibe einen Kommentar