wie man eine Dataframe-Spalte von String-Typ zu Double-Typ in pyspark ändert
Ich habe einen dataframe mit der Spalte als Zeichenkette.
Ich wollte ändern Sie den Spalte-Typ Double-Typ in pyspark.
Folgenden ist die Art und Weise habe ich,-
toDoublefunc = UserDefinedFunction(lambda x: x,DoubleType())
changedTypedf = joindf.withColumn("label",toDoublefunc(joindf['show']))
Wollte nur wissen , ist das der richtige Weg, es zu tun, als beim laufen
durch Logistische Regression , bin ich immer einige Fehler, so Frage ich mich ,
ist dies der Grund für die Probleme.
InformationsquelleAutor der Frage Abhishek Choudhary | 2015-08-29
Du musst angemeldet sein, um einen Kommentar abzugeben.
Gibt es keine Notwendigkeit für eine UDF hier.
Column
bietet bereitscast
Methode mitDataType
Beispiel:oder kurz string:
InformationsquelleAutor der Antwort zero323
Erhalten den Namen der Spalte und keine extra Spalte neben der durch die Verwendung der gleichen Namen wie die Eingabe-Spalte:
InformationsquelleAutor der Antwort Disha
die Lösung war einfach -
InformationsquelleAutor der Antwort Abhishek Choudhary
Gegebenen Antworten sind genug, um mit dem problem umzugehen, aber ich möchte einen anderen Weg, der vielleicht mal die neue version von Spark (ich bin mir nicht sicher) so gegebenen Antwort nicht fangen.
Erreichen, können wir die Spalte, in der spark-Anweisung mit
col("colum_name")
Stichwort:InformationsquelleAutor der Antwort serkan kucukbay