Hive — split-Daten in Dateien

Ist es, einen Weg zu weisen Hive zum aufteilen der Daten in mehrere Ausgabe-Dateien? Oder vielleicht cap die Größe der Ausgabe-Dateien.

Ich bin der Planung bis zur Nutzung die Rotverschiebung, die empfiehlt Aufspaltung der Daten in mehrere Dateien zu ermöglichen das parallele laden http://docs.aws.amazon.com/redshift/latest/dg/t_splitting-data-files.html

Wir Vorverarbeiten alle Daten in hive, und ich Frage mich, ob es einen Weg gibt, zu erstellen, zu sagen, 10 1-GB-Dateien, die Sie kopieren, um die Rotverschiebung schneller.

War ich bei der Suche https://cwiki.apache.org/Hive/adminmanual-configuration.html und https://cwiki.apache.org/confluence/display/Hive/Configuration+Eigenschaften aber ich kann nichts finden,

Schreibe einen Kommentar