Wie funktioniert die Funktion Distinct () in Spark?

Ich bin ein Neuling auf Apache Spark und war lernen grundlegende Funktionalitäten.
Hatte einen kleinen Zweifel.Angenommen ich habe ein RDD von Tupeln (Schlüssel, Wert) - und wollte, um einige Einzelstücke aus Ihnen heraus. Benutze ich distinct() Funktion. Ich Frage mich, auf welcher Grundlage die Funktion betrachten, die Tupel als disparate..? Ist es auf der Grundlage der Schlüssel oder Werte oder beides?

InformationsquelleAutor der Frage preetham madeti | 2015-06-20

Schreibe einen Kommentar