verwenden Sie die Länge-Funktion substring in spark
Ich versuche, verwenden Sie die Länge-Funktion innerhalb einer Funktion substring in einem DataFrame
aber es gibt Fehler
val substrDF = testDF.withColumn("newcol", substring($"col", 1, length($"col")-1))
unten ist der Fehler
error: type mismatch;
found : org.apache.spark.sql.Column
required: Int
Ich bin mit 2.1.
InformationsquelleAutor satish | 2017-09-21
Du musst angemeldet sein, um einen Kommentar abzugeben.
Funktion "expr" kann verwendet werden:
Ausgabe:
InformationsquelleAutor pasha701
Konnte man auch mit $"SPALTE".substr
Ausgabe:
InformationsquelleAutor shabbir hussain
Erhalten Sie diesen Fehler, weil Sie die Unterschrift des
substring
istDen
len
argument, dass Sie auf der Durchreise sind, ist eineColumn
, und sollte einInt
.Können Sie möglicherweise möchten, implementieren Sie eine einfache UDF um dieses problem zu lösen.
InformationsquelleAutor elghoto
Wenn alle Sie wollen, ist zu entfernen Sie die letzten Zeichen der Zeichenfolge, die Sie tun können, ohne UDF-als auch. Durch die Verwendung
regexp_replace
:InformationsquelleAutor philantrovert