Sortieren eine riesige text-Datei mit hadoop

Ist es möglich, zu Sortieren, eine riesige text-Datei lexikographisch mit einem mapreduce-job die einzige Karte, Aufgaben und keine Aufgaben reduzieren?

Datensätze der Textdatei getrennt durch ein neue-Zeile-Zeichen und die Größe der Datei ist rund 1 Terra Byte.

Wird es groß sein, wenn jemand kann empfehlen, einen Weg zu erreichen Sortierung auf dieser riesigen Datei.

  • Gibt es einen Grund für die nicht wollen, haben einen reduzieren task?
InformationsquelleAutor Arun Vasu | 2013-02-15
Schreibe einen Kommentar