Zeichen-Codierung in R
Ich versuche zu Lesen ein csv
- Datei generiert, die von Sql Server Management Studio und codiert, wie UTF-8
(ich entschied mich für diese option beim speichern) in R
version 3.0.1 (x64) durch read.csv2()
. Ich kann nicht R, um die Anzeige von Sonderzeichen korrekt.
Wenn ich fileEncoding="UTF-8-BOM"
der import Stoppt bei der Zeile wo ich ein ÿ. Jedoch, beim öffnen der Datei in Notepad++
des ÿ wird korrekt angezeigt mit UTF-8
Codierung. Ich habe versucht, ohne fileEncoding
, aber dann werden die Sonderzeichen nicht korrekt angezeigt (natürlich).
Den csv-flie gibt es hier:
https://www.dropbox.com/s/7y47i826ikq8ahi/Data.csv
Wie lese ich die csv-Datei und zeigt den text in der richtigen Zeichencodierung?
Dank!!
Du musst angemeldet sein, um einen Kommentar abzugeben.
Fand ich die Antwort selbst. Das problem war mit der transformantion von UTF-8-Gebietsschema des Systems (die Standard-Kodierung in R) durch
fileEncoding
. Da ichRStudio
, ich habe gerade das default encoding auf UTF-8 und entfernt diefileEncoding="UTF-8-BOM"
ausread.csv
. Dann, die gesamte csv-Datei gelesen wurde, und RStudio zeigt alle Zeichen korrekt.Diejenigen, die sich immer noch nicht mit diesem Thema. Meine scripts waren in der Lage, zu erkennen, "umlaute" (ä, ö, ü, oder ß) darunter eine Zeile am Anfang des Skripts, die änderungen der Standard-option für Zeichenkodierung
options(encoding = "UTF-8")
(In meinem Fall die Einstellung der Optionen in RStudio direkt hat keinen Einfluss auf die Kodierung!).