Hadoop: Schlüssel und Wert sind tab-getrennt in die Ausgabedatei. wie es zu tun Semikolon-getrennt?
Ich denke, der Titel ist bereits erklärt meine Frage. Ich würde das gerne ändern
key (tab space) value
in
key;value
in alle output-Dateien sind die Reduzierstücke-Generierung aus der Ausgabe von Mappern.
Konnte ich nicht finden gute Dokumentation, die auf dieser mit google. Kann jemand bitte geben Sie nur einen Bruchteil des Codes, wie Sie diese erreichen?
welche version (0.20.2, 0.20.20 x, 1.0.x, 2.0.0?) und-Distribution (Apache, Cloudera?) von hadoop sind Sie mit
Was verwenden Sie als Ausgabeformat Klasse:
Was verwenden Sie als Ausgabeformat Klasse:
o.a.h.mapred.TextOutputFormat
oder o.a.h.mapreduce.lib.output.TextOutputFormat
?InformationsquelleAutor Bob | 2012-06-14
Du musst angemeldet sein, um einen Kommentar abzugeben.
Legen Sie die Eigenschaft Konfiguration
mapred.textoutputformat.separator
zu";"
es sollte mapreduce.Ausgabe.textoutputformat.Trennzeichen wenn Sie die neue API
1.0.0 zeigt noch
mapred.textoutputformat.separator
in seiner Quelle füro.a.h.mapreduce.lib.output.TextOutputFormat
- svn.apache.org/viewvc/hadoop/common/tags/release-1.0.0/src/..., Zeile 115MR2 (GARN), hat sich dies geändert zu
mapreduce.textoutputformat.separator
können darüber im klaren sein, was es bedeutet, eine neue vs alte API. Wenn Sie alles vor, um hadoop 2 (YARN), dann ist es
mapred.textoutputformat.separator
unabhängig, ob Sieo.a.h.mapred.TextOutputFormat
odero.a.h.mapreduce.lib.output.TextOutputFormat
, sonst mit 2+ (GARN) es istmapreduce.textoutputformat.separator
unabhängig von was auch immer-version von TextOutputFormat, die Sie verwenden. Für Cloudera basierten Versionen vor v4 seinemapred.textoutputformat.separator
, v4+ ist esmapreduce.textoutputformat.separator
InformationsquelleAutor Chris White
Mangels besserer Dokumentation, hier ist, was ich gesammelt habe:
InformationsquelleAutor xgMz
können Sie "KEY_VALUE_SEPERATOR" Eigentum von "KeyValueLineRecordReader" geben Sie ein Trennzeichen Ihrer Wahl.
InformationsquelleAutor Tariq