Struktur: parsing JSON

Ich versuche, einige Werte aus der verschachtelten JSON für Millionen von Zeilen (5 TB+ Tabelle). Was ist der effizienteste Weg, dies zu tun?

Hier ist ein Beispiel:

{"country":"US","page":227,"data":{"ad":{"impressions":{"s":10,"o":10}}}}

Brauche ich diese Werte aus der oben genannten JSON:

Country        Page      impressions_s       impressions_o
---------      -----     -------------       --------------
US              2        10                  10

Dies ist Bienenstock json_tuple Funktion, ich bin nicht sicher, ob dies ist die beste Funktion.
https://cwiki.apache.org/confluence/display/Hive/LanguageManual+UDF#LanguageManualUDF-getjsonobject

InformationsquelleAutor Don P | 2012-09-28
Schreibe einen Kommentar