Ist gzip-format unterstützt in der Funke?

Für eine Big-Data-Projekt, ich bin der Planung bis zur Nutzung spark, die hat einige nette features, wie in-memory-Berechnungen für die wiederholte workloads. Es kann auf lokale Dateien oder auf dem HDFS.

Jedoch in der offiziellen Dokumentation kann ich nicht finden, irgendeinen Hinweis, wie zu Verfahren Gzip-Dateien. In der Praxis kann es sehr effizient zu verarbeiten .gz-Dateien anstelle der entpackten Dateien.

Gibt es eine Möglichkeit manuell zu implementieren, die das Lesen von Gzip-Dateien oder dem entpacken schon automatisch beim Lesen ein .gz-Datei?

InformationsquelleAutor ptikobj | 2013-04-30
Schreibe einen Kommentar