Funkenverbindung mehrerer RDDs

In mein Schwein code, mit dem ich dies tun:

all_combined = Union relation1, relation2, 
    relation3, relation4, relation5, relation 6.

Möchte ich das gleiche tun mit spark. Jedoch, leider, ich sehe, dass ich zu tun zu halten Sie paarweise:

first = rdd1.union(rdd2)
second = first.union(rdd3)
third = second.union(rdd4)
# .... and so on

Gibt es einen union-operator, mit denen ich mehrere rdds:

z.B. union(rdd1, rdd2,rdd3, rdd4, rdd5, rdd6)

Ist es eine Frage von Bequemlichkeit.

InformationsquelleAutor der Frage user3803714 | 2015-11-16

Schreibe einen Kommentar