Spark - Die instance-Typ wird bevorzugt für AWS-EMR-cluster?

Ich bin mit einige machine learning algorithmen auf EMR-Spark-cluster. Ich bin neugierig, welche Art von Instanz zu verwenden, so kann ich den optimalen Kosten - /performance-Gewinn?

Für die gleiche Höhe der Preise, ich kann wählen zwischen:

          vCPU  ECU  Memory(GiB)
m3.xlarge  4     13     15     
c4.xlarge  4     16      7.5
r3.xlarge  4     13     30.5

Welche Instanz verwendet werden soll, in EMR-Spark-cluster?

es hängt von Ihrem Anwendungsfall, Bedürfnisse, etc... (ganz Meinung QA)
Gerade was zum Beispiel, wenn ich bin gehen, um dem Zug ein ALS die Faktorisierung oder SVD auf matricies mit mehreren Millionen Einträgen?
Wie groß ist Ihre Daten? in GB?
Also, was ist die Größe?
Lassen Sie uns weiter, diese Diskussion im chat.

InformationsquelleAutor shihpeng | 2015-05-25

Schreibe einen Kommentar