Gewusst wie: konvertieren eine csv-Datei zu Parkett
Ich bin neu im Bereich Big data.Ich brauche zum konvertieren einer csv/txt-Datei für Parkett-format. Ich suchte eine Menge, aber konnte keine direkte Möglichkeit, dies zu tun. Gibt es irgendeine Möglichkeit das zu erreichen?
InformationsquelleAutor der Frage author243 | 2014-09-30
Du musst angemeldet sein, um einen Kommentar abzugeben.
Hier ist ein Beispiel-Stück code, das macht es in beide Richtungen.
InformationsquelleAutor der Antwort Pratik Khadloya
Können Sie Apache Drillwie beschrieben in Konvertieren einer CSV-Datei zur Apache-Parkett Mit Bohrer.
In Kürze:
Starten Sie Den Apache Drill:
Erstellen, Parkett-Datei:
Versuchen Sie, Daten aus den neuen Parkett-Datei:
Können Sie ändern Sie die
dfs.tmp
Lage, indem Sie zuhttp://localhost:8047/storage/dfs
(Quelle: CSV und Parkett).InformationsquelleAutor der Antwort ostrokach
Der folgende code ist ein Beispiel für die Verwendung spark2.0. Lesen ist viel schneller als inferSchema option. Spark 2.0 konvertieren in Parkett-Datei in viel effizienter als spark1.6.
InformationsquelleAutor der Antwort Madhu Kiran Seelam
Ich schon gepostet eine Antwortwie dies mit Apache Drill. Allerdings, wenn Sie vertraut sind mit Python, können Sie nun dazu verwenden Pandas und PyArrow!
Installieren, Abhängigkeiten
Mit
pip
:oder mit
conda
:Konvertieren Sie CSV zu Parkett in Blöcken
Habe ich noch nicht getestet mit diesem code auf die Apache Drill version, aber meiner Erfahrung nach ist es viel schneller, konvertieren von Zehntausenden von Zeilen, die pro Sekunde (dies hängt von der CSV-Datei natürlich!).
InformationsquelleAutor der Antwort ostrokach
1) können Sie eine externe hive-Tabelle
2) ein Weiterer hive-Tabelle, die speichert Parkett-Datei
Die Tabelle einfügen Daten in Tabelle zwei :
InformationsquelleAutor der Antwort Hemant Kumar
Lesen csv-Dateien als Dataframe in Apache Spark mit spark-csv-Paket. nach dem laden von Daten Dataframe speichern dataframe zu parquetfile.
InformationsquelleAutor der Antwort Milad Khajavi
InformationsquelleAutor der Antwort Shuli Hakim