brauche Hilfe für den Vergleich von zwei Spalten in spark scala
Habe ich spark dataframe wie diese
id1 id2 attrname attr_value attr_valuelist
1 2 test Yes Yes, No
2 1 test1 No Yes, No
3 2 test2 value1 val1, Value1,value2
4 1 test3 3 0, 1, 2
5 3 test4 0 0, 1, 2
11 2 test Yes Yes, No
22 1 test1 No1 Yes, No
33 2 test2 value0 val1, Value1,value2
44 1 test3 11 0, 1, 2
55 3 test4 0 0, 1, 2
val df = sqlContext.sql("select id1, id2, attrname, attr_value, attr_valuelist from dftable)
möchte ich überprüfen, attr_value. in attr_valuelist wenn es nicht existiert, dann nehmen Sie nur diese Zeilen
id1 id2 attrname attr_value attr_valuelist
4 1 test3 3 0, 1, 2
22 1 test1 No1 Yes, No
33 2 test2 value0 val1, Value1,value2
44 1 test3 11 0, 1, 2
Du musst angemeldet sein, um einen Kommentar abzugeben.
können Sie einfach führen Sie folgende Aktionen enthält in Ihrem dataframe
sollten Sie folgende Ausgabe
Wenn Sie wollen ignorieren die groß-und Kleinschreibung dann können Sie einfach Benutzer
lower
Funktion alssollten Sie
Können Sie definieren eine benutzerdefinierte Funktion benutzerdefinierte Funktion in der Funke, wo Sie können testen, ob ein Wert aus einer Spalte enthalten ist, in den Wert der anderen Spalte, wie folgt:
können Sie tweak enthält eine Funktion, wie Sie wollen, und dann können Sie von Ihrem dataframe wie diese