Wie funktioniert Schwein verarbeiten von unstrukturierten Daten, während Hive nicht kann?

Laut diese und sonstige Verweise Schwein ist besser als Hive verarbeiten von unstrukturierten Daten. So, die Daten zuerst gereinigt mit Schwein und dann verarbeitet mit Bienenkorb.

Aber, in der data factory, können keine Daten werden in einem schönen, einheitlichen Staat noch. Dieses Schwein macht eine gute Passform für diesen Anwendungsfall, denn es unterstützt Daten-auch teilweise oder unbekannte schemas, und semi-strukturierte oder unstrukturierte Daten handelt.

Möchte mehr wissen, wie Schweine behandeln können unstrukturierte Daten, während Hive nicht.

Schreibe einen Kommentar