Temp-Tabelle Zwischenspeichern mit spark-sql
Ist eine Tabelle registriert mit registerTempTable
(createOrReplaceTempView
mit Funke 2.+) zwischengespeichert?
Verwendung von Zeppelin, registriere ich eine DataFrame
in mein scala-code, nach der Berechnung, und dann innerhalb %pyspark
ich darauf zugreifen möchten, und weitere filter.
Wird es einen memory-Cache-version der Tabelle? Oder wird es neu erstellt werden jedes mal?
InformationsquelleAutor Cedric H. | 2016-08-31
Du musst angemeldet sein, um einen Kommentar abzugeben.
Registrierten Tabellen werden nicht im Arbeitsspeicher zwischengespeichert.
registerTempTable
createOrReplaceTempView
Methode wird nur erstellen oder zu ersetzen, angesichts der gegebenenDataFrame
mit einem gegebenen query-plan.Wird es konvertiert die Abfrage-plan zu kanonisierten SQL-string und speichern Sie es als text in metastore, wenn wir brauchen, um eine permanente anzeigen.
Müssen Sie den cache Ihres DataFrame ausdrücklich. e.g :
EDIT:
Veranschaulichen wir das mit einem Beispiel :
Mit
cacheTable
:Nun das gleiche Beispiel mit
cache.registerTempTable
cache.createOrReplaceTempView
:InformationsquelleAutor eliasah
Ist es nicht. Sie sollten cache explizit:
InformationsquelleAutor