Spark num-Vollzieher

Ich habe setup ein 10-Knoten-HDP-Plattform auf AWS. Unten ist meine Konfiguration
2 Server - Namen, Knoten-und Standby-Name-Knoten
7 Daten-Knoten und jeder Knoten hat 40 vCPUs und 160 GB Speicher.

Ich versuche zu berechnen, die Anzahl der Testamentsvollstrecker bei der übermittlung spark-Anwendungen und nachdem Sie durch verschiedene blogs bin ich verwirrt, auf was dieser parameter eigentlich bedeutet.

Blick auf die unten blog scheint es, die num-Vollzieher die Gesamtzahl der Testamentsvollstrecker über alle Knoten
http://blog.cloudera.com/blog/2015/03/how-to-tune-your-apache-spark-jobs-part-2/

Aber ein Blick auf die unten blog-es scheint, dass die num-Vollzieher wird pro Knoten oder server
https://blogs.aws.amazon.com/bigdata/post/Tx578UTQUV7LRP/Submitting-User-Applications-with-spark-submit

Kann jemand bitte klären, und überprüfen Sie die unten :-

  1. Ist die num-Vollzieher Wert wird pro Knoten oder die Gesamtzahl der Vollzieher auf alle data-Knoten.
  2. Bin ich über den untenstehenden Berechnung zu kommen mit der core-Anzahl, Testamentsvollstrecker Graf und Speicher pro Testamentsvollstrecker

    Anzahl der Kerne <= 5 (Annahme 5)
    Num Vollzieher = (40-1)/5 = 7
    Speicher = (160-1)/7 = 22 GB

Mit der obigen Berechnung, die der korrekte Weg wäre,

--master yarn-client --driver-memory 10G --executor-memory 22G --num-executors 7 --executor-cores 5 

OR

--master yarn-client --driver-memory 10G --executor-memory 22G --num-executors 49 --executor-cores 5 

Dank,
Jayadeep

Als schön getupft von Marco num-executors entfernt wurde in 2.0+.
Danke, ich bin derzeit auf der Verwendung von Spark-1.6.0 und würde gerne wissen, wie diese Parameter verwendet werden und berechnet

InformationsquelleAutor jjayadeep | 2016-09-13

Schreibe einen Kommentar