Wie kann ich die Ausgabe hadoop Ergebnis im csv-format
Ich ausgeben muss mein hadoop in Folge .csv-format.
wie mache ich das?
Mein code :https://github.com/studhadoop/xml/blob/master/XmlParser11.java
sollte ich einfach csvoutputFormat in meinem code.
Ich bin mit mapreduce API
myjob.sh
bin/hadoop jar /var/root/ALA/ala_jar/clsperformance.jar ala.clsperf.ClsPerf /user/root/ala_xmlrpt/Amrita\ Vidyalayam\,\ Karwar_Class\ 1\ B_ENG.xml /user/root/ala_xmlrpt-outputshell4
bin/hadoop fs -get /user/root/ala_xmlrpt-outputshell4/part-r-00000 /Users/jobsubmit
cat /Users/jobsubmit/part-r-00000 /Users/jobsubmit/output.csv
LÖSUNG
ys, die mir fehlte, > in cat
cat /Users/jobsubmit/part-r-00000> /Users/jobsubmit/output.csv
Du musst angemeldet sein, um einen Kommentar abzugeben.
Können Sie TextOutputFormat. Der Standard-Schlüssel/Wert-Trennzeichen ist ein Tabulator-Zeichen. Können Sie das Trennzeichen ändern, das durch das setzen der Eigenschaft "mapred.textoutputformat.separatorText" in Ihre Treiber.
cat /Users/jobsubmit/part-r-00000 > /Users/jobsubmit/output.csv
Hinweis ">" in die Befehlszeile, welche die std-Ausgabe in die Datei. Auch "Teil-r -*", so dass, wenn mehrere Dateien da sind, werden alle Dateien berücksichtigt.