Export-Hive-Tabelle, csv in hdfs

Ich weiß, es ist ein bekanntes Problem mit Trennzeichen beim speichern einer Tabelle in das csv - (oder andere text-Datei) in den Bienenstock. So Frage ich mich, wenn Euch kann mir helfen, dass rund.

Ich habe eine vorhandene Tabelle (Tabelle A), und ich möchte speichern Sie Sie im csv-format zu hdfs. Aus dem Lesen der anderen Antworten, die ich glaube, ich würde zuerst erstellen Sie eine externe Tabelle (aber ich bin mir nicht sicher, wie die ganze Sache Aussehen würde).

Kann jemand helfen?

  • Persönlich würde ich nur verwenden insert overwrite directory und haben eine \001 Datei mit Trennzeichen. Aber wenn Sie eine csv -, ich glaube, du bist am besten aus Rohrleitungen die Abfrage zu einer lokalen .csv und dann hadoop fs -put-ing in hdfs, das ist hier beschrieben stackoverflow.com/questions/18129581/...
  • Ich möchte vermeiden, speichern eine große Datei in das lokale Verzeichnis, wenn möglich. Mein Problem ist, dass ich dann benötigen, um die Datei zu laden in R, und dies zu tun, die Sie normalerweise geben Sie ein Trennzeichen, nicht sicher, wie das funktionieren würde (oder, wenn es funktionieren würde) mit einem unsichtbaren Charakter.
  • Ich lade Daten aus hdfs zu entfachen, und geben Sie das als Begrenzungszeichen "\001". Ich habe noch nie hatte (ein Grund) für den import einer Datei aus dem HDFS zu R, aber ich würde davon ausgehen, es kann ein beliebiges Trennzeichen, solange es richtig angegeben ist.
InformationsquelleAutor Laura | 2015-05-13
Schreibe einen Kommentar