Was ist der Unterschied zwischen spark ' s shuffle Lesen und shuffle schreiben?

Muss ich laufen, eine spark-Programm, das hat eine riesige Menge an Daten. Ich bin versucht zu optimieren, das spark-Programm und die durch spark-UI und versucht, um den Shuffle-Teil.

Gibt es paar der genannten Komponenten, shuffle Lesen und shuffle schreiben. Ich kann verstehen, dass die Differenz basiert Ihre Terminologie, aber ich würde gerne verstehen, die genaue Bedeutung von Ihnen und die von spark ' s shuffle lese - /Schreibzugriff reduziert die Leistung?

Suchte ich über das internet, aber nicht finden konnten, eine solide in die Tiefe details über Sie, so wollte, um zu sehen, wenn jemand kann erklären Sie hier.

  • Nummer-eins-Optimierung-Tipp in der Funke: versuchen Sie, reduzieren Sie die Anzahl der shuffles.
InformationsquelleAutor Srini | 2016-03-06
Schreibe einen Kommentar