Umgang mit Feldern in Anführungszeichen (CSV) beim Importieren von Daten aus S3 in DynamoDB mit EMR / Hive

Ich versuche, mit EMR - /Hive importieren von Daten aus S3 in DynamoDB. Meine CSV-Datei hat Felder, die sind eingeschlossen in doppelten Anführungszeichen und durch Komma getrennt.
Beim anlegen der externen Tabelle in hive, ich bin in der Lage, geben Sie Trennzeichen wie Komma, aber wie kann ich festlegen, dass Felder, die sind eingeschlossen in Anführungszeichen?

Wenn ich nicht angeben, ich sehe, dass die Werte in DynamoDB sind aufgefüllt, die innerhalb von zwei doppelten Anführungszeichen ""Wert"" das scheint falsch zu sein.

Ich bin mit dem folgenden Befehl create external table. Gibt es eine Möglichkeit, um anzugeben, dass die Felder eingeschlossen in doppelten Anführungszeichen?

CREATE EXTERNAL TABLE emrS3_import_1(col1 string, col2 string, col3 string, col4 string)  ROW FORMAT DELIMITED FIELDS TERMINATED BY '","' LOCATION 's3://emrTest/folder';

Irgendwelche Vorschläge würden geschätzt.
Dank
Jitendra

InformationsquelleAutor der Frage RandomQuestion | 2012-12-27

Schreibe einen Kommentar