Hinzufügen Spaltentitel, um die hive-Ergebnis eingestellt
Ich bin mit einem hive-Skript in Amazon EMR zu analysieren, einige Daten.
Und ich bin mit der übertragung der Ausgabe auf Amazon s3-bucket. Nun die Ergebnisse der hive-Skripts nicht enthalten Spaltenüberschriften.
Habe ich auch versucht, mit Hilfe dieser:
set hive.cli.print.header=true;
Aber es hilft nicht. Können Sie mir helfen?
- Wollen Sie die Spaltenüberschriften enthalten in eine output-Datei nur sehen, wie Sie im command-line-interface?
- Ich möchte Ihnen in der Ausgabe-Datei.
Du musst angemeldet sein, um einen Kommentar abzugeben.
Genau das, was tut Ihr hive-Skript Aussehen?
Nimmt der Ausgang von deinem hive-Skript die header-Daten? Ist es dann verloren gehen, wenn Sie kopieren Sie die Ausgabe auf Ihrem s3-bucket?
Wenn Sie könnte einige weitere details über genau das, was du tust, das wäre hilfreich.
Ohne zu wissen, die details, hier ist etwas, das Sie ausprobieren könnten.
Erstellen Sie Ihre hive-Skript wie folgt:
Führen Sie dann das Skript:
Kopieren Sie dann Ihre Ausgabe auf Ihrem s3-bucket
Ich denke, der direkte Weg ist immer noch unmöglich (HIve: das schreiben der Spaltenüberschriften, um die lokale Datei?).
Eine Lösung wäre der export Ergebnis
DESCRIBE table_name
Datei:Schreiben und einige Skript, fügen Sie den Spaltennamen in Ihrer Daten-Datei. GL!
Ich lief in dieses problem heute und war in der Lage zu bekommen, was ich brauchte, durch eine UNION zwischen der ursprünglichen Abfrage und eine neue dummy-Abfrage erstellt die header-Zeile. Ich habe eine Spalte Sortieren klicken Sie auf jedem Abschnitt, und legen Sie den header auf 0 und die Daten auf eine 1, so konnte ich Sortieren nach diesem Feld und sorgen für die header-Zeile kam heraus auf die Oberseite.
Es ist ein wenig sperrig, aber zumindest können Sie bekommen, was Sie brauchen, mit einer einzigen Abfrage.
Hoffe, das hilft!
Es vielleicht nur ein Tippfehler (oder eine version-abhängige änderung), aber Folgendes funktioniert bei mir:
Es ist "headers" statt "header"