Wie konvertiert \xXY-codierte Zeichen in UTF-8 in Python?

Ich habe einen text, der Zeichen enthält, z.B. "\xaf", "\xbe", die, so wie ich es verstehe aus diese Frage, sind ASCII-codierte Zeichen.

Möchte ich umwandeln in Python, um Ihre UTF-8-äquivalente. Die üblichen string.encode("utf-8") wirft UnicodeDecodeError. Gibt es eine bessere Art und Weise, z.B. mit der codecs standard-Bibliothek?

Probe 200 Zeichen hier.

Ihre Stichprobe umfasst keine \xaf oder ähnliches. Haben Sie keine Proben, die mit solchen Charakteren?
Ihre Beispieldaten ist gültiges UTF-8. Mit der "record separator" - und "unit separator" - Zeichen.
Nach enca (linux.die.net/man/1/enca) ist es UTF-8 "umgeben von/, vermischt mit nicht-text-Daten".

InformationsquelleAutor Jindřich Mynarz | 2011-01-19

Schreibe einen Kommentar