UnicodeDecodeError: 'ascii' codec kann nicht decodieren

Bin ich beim Lesen einer Datei, die enthält die Rumänische Wörter in der Python-Datei.readline().
Ich habe Probleme mit vielen Charakteren, weil der Codierung.

Beispiel :

>>> a = "aberație"  #type 'str'
>>> a -> 'abera\xc8\x9bie'
>>> print sys.stdin.encoding
UTF-8

Habe ich versucht, encode() mit utf-8, cp500 etc, aber es funktioniert nicht.

Kann ich nicht herausfinden, welche ist die richtige Zeichencodierung muss ich verwenden ?

vielen Dank im Voraus.

Edit: Das Ziel ist das speichern von word aus Datei in ein dictionnary, und beim drucken zu erhalten aberație und nicht 'abera\xc8\x9bie'

InformationsquelleAutor lilawood | 2011-06-30
Schreibe einen Kommentar