UnicodeDecodeError: 'utf-8' codec kann nicht decodieren byte 0xcc in position 3: invalid continuation byte
Ich versuche, laden Sie eine csv-Datei mit pd.read_csv
aber ich bekomme die folgenden unicode-Fehler:
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xcc in position 3: invalid continuation byte
- Könnten Sie teilen Ihren code. Das würde es einfacher machen, Ihnen zu helfen.
- Es ist nur
pd.read_csv('../filename.csv')
und dann bekomme ich das unicode-Fehler. Danke!
Du musst angemeldet sein, um einen Kommentar abzugeben.
Leider, CSV-Dateien haben keine eingebaute Methode der Signalisierung der Zeichenkodierung.
read_csv
standardmäßig vermute, dass die bytes in der CSV-Datei darstellen von text, codiert in UTF-8-Codierung. Dies führt zuUnicodeDecodeError
wenn die Datei mit einer anderen Kodierung, die Ergebnisse in bytes, die nicht zufällig eine gültige UTF-8-Sequenz. (Wenn Sie Glück haben nebenbei auch gültiges UTF-8, Sie würde nicht den Fehler, aber Sie würden immer noch falsche Eingabe für nicht-ASCII-Zeichen, das wäre wirklich schlimmer.)Es ist bis zu Sie angeben, welche Codierung ist im Spiel, das erfordert einiges an wissen (oder erraten), Woher es kam. Zum Beispiel, wenn es kam aus MS Excel auf einem western-Installation von Windows, wäre es wohl die Windows Codepage 1252 und man kann es Lesen mit:
Bekam ich die folgende Fehlermeldung
Dieser war, weil ich änderungen an der Datei und Ihrer Codierung. Sie könnten auch versuchen, ändern Sie die Kodierung der Datei auf utf-8 verwenden von code oder nqq-editor in ubuntu, wie es bietet Verzeichnis-option zum ändern der Codierung. Wenn das problem bleibt, dann versuchen Sie rückgängig machen alle änderungen in die Datei oder das Verzeichnis ändern.
Hoffe, das hilft
Kopieren Sie den code, öffnen Sie eine neue .py-Datei und code eingeben und sparen.