Wie man der letzten Zeile des DataFrame?

Ich hava ein DataFrame,das DataFrame hava zwei Spalte 'value' und 'timestamp', die 'timestmp' ist bestellt,ich möchte die Letzte Zeile des DataFrame,was soll ich tun?

dies ist mein input:

+-----+---------+
|value|timestamp|
+-----+---------+
|    1|        1|
|    4|        2|
|    3|        3|
|    2|        4|
|    5|        5|
|    7|        6|
|    3|        7|
|    5|        8|
|    4|        9|
|   18|       10|
+-----+---------+

dies ist mein code:

    val arr = Array((1,1),(4,2),(3,3),(2,4),(5,5),(7,6),(3,7),(5,8),(4,9),(18,10))
    var df=m_sparkCtx.parallelize(arr).toDF("value","timestamp")

dies ist mein erwartetes Ergebnis:

+-----+---------+
|value|timestamp|
+-----+---------+
|   18|       10|
+-----+---------+
  • Würde df.where($"timestamp" === max($"timestamp") Arbeit?
  • Es doesnot Arbeit mit Exchange rangepartitioning(ts#7 ASC NULLS FIRST, 200)
InformationsquelleAutor mentongwu | 2017-07-31
Schreibe einen Kommentar