Funke: schreiben DataFrame als komprimierte JSON

Apache Spark DataFrameReader.json() verarbeiten kann gzipped JSONlines Dateien automatisch, aber es scheint nicht zu einem Weg, um DataFrameWriter.json() zu schreiben komprimiert JSONlines-Dateien. Die zusätzliche Netzwerk-I/O ist sehr teuer in der cloud.

Gibt es einen Weg um dieses problem herum?

  • Haben Sie entdecken einen Weg, der zum komprimieren json-Ausgabe? Ich bin auch auf der Suche nach einer Lösung.
  • Ich habe nicht einen Weg fand, das zu tun dieses noch.
InformationsquelleAutor Sim | 2015-08-11
Schreibe einen Kommentar