wie zu verwenden Regexp_replace spark
Ich bin ziemlich neu zu entfachen, und möchte das ausführen einer operation auf einer Spalte mit einem dataframe, so ersetzen Sie alle ,
in der Spalte mit .
Angenommen, es gibt einen dataframe x und Spalte x4
x4
1,3435
1,6566
-0,34435
Möchte ich die Ausgabe als
x4
1.3435
1.6566
-0.34435
Den code, den ich verwende, ist
import org.apache.spark.sql.Column
def replace = regexp_replace((x.x4,1,6566:String,1.6566:String)x.x4)
Aber ich bekomme die folgende Fehlermeldung
import org.apache.spark.sql.Column
<console>:1: error: ')' expected but '.' found.
def replace = regexp_replace((train_df.x37,0,160430299:String,0.160430299:String)train_df.x37)
Jede Hilfe über die syntax, Logik oder jeder anderen geeigneten Art und Weise wäre sehr geschätzt werden
InformationsquelleAutor user3420819 | 2016-10-17
Du musst angemeldet sein, um einen Kommentar abzugeben.
Hier ist eine reproduzierbare Beispiel, angenommen
x4
ist eine string-Spalte.Die syntax ist
regexp_replace(str, pattern, replacement)
übersetzt:Sie ersetzen möchten mehrere spezielle Zeichen von einem Zeichen? ja, es ist möglich.
Ich habe versucht, aber hat nicht funktioniert. könnten Sie mir bitte sagen, wie das zu tun.
Sie könnten versuchen, so etwas wie
regexp_replace(df.col, "[\\?,\\.,\\$]", "."))
Ich habe vergessen zu sagen, dass es geklappt hat, danke!
InformationsquelleAutor mtoto