Import von "csv" - Datei mit mehreren Zeichen separator in R?

Habe ich eine "csv" - text-Datei, wo jeder Bereich ist getrennt von \t&%$# was ich jetzt versucht bin zu import in R.

Den sep= argument read.table()instists auf einen einzelnen Charakter. Gibt es eine schnelle Möglichkeit, direkt zu importieren dieser Datei?

Einige Datenfelder sind vom Benutzer übermittelten text, die Tabulatoren enthalten, Zitate, und andere schmierigen Zeug, so dass die änderung der Trennzeichen um etwas einfacher zu sein scheint, könnte es schaffen andere Probleme.

  • Wollen geben eine Probe von der Unordnung? Mein Gedanke wäre, wenn es eine einzelne Datei, kann es sinnvoll sein, nur tun, ein suchen und ersetzen auf die original-Datei. Wenn es wirklich so unordentlich ist, aber, und das wird nicht funktionieren, versuchen Sie, das Lesen in den Daten als unstrukturierte (wie readLines) und dann mit regexp auf das importierte Zeichenketten, mit denen Sie GESONDERT zu behandeln problematischen Zeilen.
  • Nicht das beste, aber ein Versuch lohnt sich: stackoverflow.com/questions/15539912/...
InformationsquelleAutor Bryan | 2013-08-12
Schreibe einen Kommentar