Tag: orc

Die Optimierte Zeile, Einspaltig (ORC) – Datei-format bietet eine sehr effiziente Möglichkeit zum speichern von Hive-Daten. Es wurde entwickelt, um überwindung von Grenzen der anderen Hive-Datei-Formate. Mit ORC-Dateien verbessert die Leistung bei der Struktur ist, Lesen, schreiben und verarbeiten von Daten.

Das Lesen eines ORC-Datei in Java

Anzahl der Antworten 3 Antworten
Wie liest man eine ORC-Datei in Java? Ich bin zu wollen, Lesen Sie in einer kleinen Datei, die für einige unit-test-Ausgabe überprüfung, aber ich kann nicht finden eine Lösung. InformationsquelleAutor Ben Watson | 2015-09-22

hive semantische Ausnahme beim einfügen der Daten

Anzahl der Antworten 2 Antworten
Erstellte ich eine hive-Tabelle mit ORC. Wenn ich für das einfügen von Daten aus der hive-Konsole funktioniert es perfekt.Aber Wenn ich das einfügen von Daten aus der Jdbc-code.Es wirft hive semantische Ausnahme. Fehler rg.apache.hive.service.cli.HiveSQLException: Fehler beim kompilieren

Aggregieren von mehreren Spalten mit einer benutzerdefinierten Funktion in der Funke

Anzahl der Antworten 4 Antworten
Ich Frage mich, ob es eine Möglichkeit gibt, geben Sie eine benutzerdefinierte aggregation-Funktion für spark dataframes über mehrere Spalten. Ich habe eine Tabelle wie diese von der Art (name, Artikelnummer, Preis): john | tomato | 1.99 john

Parkett vs ORC vs ORC mit Snappy

Anzahl der Antworten 5 Antworten
Ich bin mit ein paar tests auf den Speicher-Formaten erhältlich mit Struktur und mit Parkett und ORC als wichtige Optionen. Ich ORC, einmal mit Standard-Kompression und einmal mit Bissig. Ich habe gelesen, dass viele Dokumente, die Staatliche