Import von "csv" - Datei mit mehreren Zeichen separator in R?
Habe ich eine "csv" - text-Datei, wo jeder Bereich ist getrennt von \t&%$#
was ich jetzt versucht bin zu import in R.
Den sep=
argument read.table()
instists auf einen einzelnen Charakter. Gibt es eine schnelle Möglichkeit, direkt zu importieren dieser Datei?
Einige Datenfelder sind vom Benutzer übermittelten text, die Tabulatoren enthalten, Zitate, und andere schmierigen Zeug, so dass die änderung der Trennzeichen um etwas einfacher zu sein scheint, könnte es schaffen andere Probleme.
- Wollen geben eine Probe von der Unordnung? Mein Gedanke wäre, wenn es eine einzelne Datei, kann es sinnvoll sein, nur tun, ein suchen und ersetzen auf die original-Datei. Wenn es wirklich so unordentlich ist, aber, und das wird nicht funktionieren, versuchen Sie, das Lesen in den Daten als unstrukturierte (wie
readLines
) und dann mit regexp auf das importierte Zeichenketten, mit denen Sie GESONDERT zu behandeln problematischen Zeilen. - Nicht das beste, aber ein Versuch lohnt sich: stackoverflow.com/questions/15539912/...
Du musst angemeldet sein, um einen Kommentar abzugeben.
Dem folgenden code wird in der Lage sein, um mehrere Trennzeichen chars:
Erläutert in dieser Beitrag, es ist nicht möglich, in R ohne Rückgriff auf string-parsing. Sie können pre-analysieren Sie Ihre Datei in einer anderen Sprache (Awk, Perl, Python etc.) oder Lesen Sie es Zeile für Zeile und analysieren des resultierenden strings in R.