Fehler 'Embedded nul in string' beim Importieren von CSV mit fread
Ich habe eine große Datei (3,5 G), die ich versuche zu importieren mit data.table::fread
.
Es wurde ursprünglich von einer rpt-Datei geöffnet wurde, die als text gespeichert und als CSV.
Das hat alles geklappt mit kleineren Dateien (der gleichen Art von Daten-Spalten und alle. Dieser ist nur für einen längeren Zeitraum und größere Reichweite).
Wenn ich versuche und ausführen
mydata <- fread("mycsv.csv")
Bekomme ich die Fehlermeldung:
Fehler bei fread("mycsv.csv") : embedded nul in string: 'y\0e\0a\0r\0'
Was bedeutet das?
InformationsquelleAutor der Frage datahappy | 2014-03-25
Du musst angemeldet sein, um einen Kommentar abzugeben.
Können wir entfernen Sie den null-terminatoren auf der Kommandozeile mit so etwas wie:
Oder wie vorgeschlagen von @marbel, fread können Sie übergeben die sed Aufruf innerhalb der text. Wie:
InformationsquelleAutor der Antwort Robert Krzyzanowski
In diesem Fall können Sie
read.csv
mit fileEncoding von UTF-16LE eher alsfread
.Unter Berücksichtigung der Größe der Daten, mit
read.csv
würde nehmen Sie ein paar Minuten, aber ich denke, es ist keine große Sache.InformationsquelleAutor der Antwort Fan
Können Sie testen, diese kleine Funktion:
Es ist Arbeit für mich
InformationsquelleAutor der Antwort xrsousa
Nicht-technische Möglichkeit, dies zu lösen wäre, zu
Öffnen Sie die problematische .csv -
Strg+A (alles Auswählen)
Öffnen Sie ein neues Excel-sheet
Rechten Maustaste und wählen Sie "Einfügen als Werte"
Speichern und verwenden Sie diese Datei anstelle des Originals ein.
Arbeitete für mich, und nicht viel Zeit.
InformationsquelleAutor der Antwort Pree