PySpark: mehrere Bedingungen in der wenn-Klausel

Möchte ich ändern Sie die Werte von Zellen eines dataframe Spalte (Alter), wo es derzeit ist leer und ich würde es nur tun, wenn eine andere Spalte (Überlebt) hat den Wert 0 für die entsprechende Zeile, wo es leer ist für das Alter. Wenn es 1 ist in das Überlebt Spalte aber leer, in der Spalte " Age " dann halte ich es als null.

Habe ich versucht zu verwenden && Betreiber, aber es hat nicht funktioniert. Hier ist mein code:

tdata.withColumn("Age",  when((tdata.Age == "" && tdata.Survived == "0"), mean_age_0).otherwise(tdata.Age)).show()

Irgendwelche Vorschläge, wie damit umzugehen ist? Danke.

Fehlermeldung:

SyntaxError: invalid syntax
  File "<ipython-input-33-3e691784411c>", line 1
    tdata.withColumn("Age",  when((tdata.Age == "" && tdata.Survived == "0"), mean_age_0).otherwise(tdata.Age)).show()
                                                    ^
InformationsquelleAutor sjishan | 2016-06-08
Schreibe einen Kommentar