Wie die Rückkehr ein "Tupel-Typ" in einer UDF in PySpark?

Alle Datentypen in pyspark.sql.Typen werden:

__all__ = [
    "DataType", "NullType", "StringType", "BinaryType", "BooleanType", "DateType",
    "TimestampType", "DecimalType", "DoubleType", "FloatType", "ByteType", "IntegerType",
    "LongType", "ShortType", "ArrayType", "MapType", "StructField", "StructType"]

Ich zu schreiben, ein UDF (in pyspark) gibt ein array von Tupeln. Was muss ich geben, das zweite argument ist der Typ des Rückgabewert der udf-Methode? Es würde etwas sein, auf den Linien der ArrayType(TupleType())...

  • Deine Titel-Frage scheint nicht zu passen den Körper. Nicht in der Dokumentation erzählen Sie, wie man einen return-Wert "- container Typ der anderen Art"?
  • Ich habe den Titel geändert. Hoffentlich ist es repräsentativ für den Körper jetzt.
InformationsquelleAutor kamalbanga | 2016-04-25
Schreibe einen Kommentar