Macht eine Verknüpfung von co-partitioniert RDDs verursachen einen shuffle in Apache Spark?

Wird rdd1.join(rdd2) Ursache shuffle passieren, wenn rdd1 und rdd2 haben die gleichen Partitionierer?

  • Können Sie umschreiben diese Frage, um deutlicher zu sein? Nur weil RDDs Partitionen auf derselben Maschine bedeutet nicht, dass alle Tasten immer auf der gleichen partition über beide. Was fragst du dann?
  • Ich habe umgeschrieben, die Frage vollständig. Ich denke, es macht jetzt Sinn, aber ich bin mir nicht sicher, es ist das, was @zwb gemeint. Ich habe nicht wirklich verstehen, das original. Fühlen Sie sich frei, um wieder meine Bearbeiten und aktualisieren Sie die Frage, falls erforderlich.
  • Danke, ich komme aus china und mein Englisch ist schlecht,ich kann nicht, drücke mich sehr klar und deutlich, was Sie umgeschrieben ist mein Gefühl.
InformationsquelleAutor zwb | 2015-02-08
Schreibe einen Kommentar