mit erweiterten Ascii-Code mit Python
Habe ich einen dictionnary mit Python, aber ich habe Probleme mit erweiterten Ascii-codes.
Die Schleife, die creats die dictionnary ist : (ascii-Nummer 128 bis 164 : é,à usw.)
#extented ascii codes
i = 128
while i <= 165 :
dictionnary[chr(i)] = 'extended ascii'
i = i + 1
Aber wenn ich versuche, mit dictionnary :
>>> dictionnary['è']
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
KeyError: '\xc3\xa8'
Ich habe # -- coding: utf-8 -- in der Kopfzeile das python-Skript.
Ich habe versucht, codieren,decodieren etc, aber das Ergebnis ist immer schlecht.
Zu verstehen, was passiert, die ich ausprobiert habe :
>>> ord('é')
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: ord() expected a character, but string of length 2 found
und
>>> ord(u'é')
233
Ich bin verwirrt mit ord(u'é"), weil 'é' ist die Nummer 130 in der erweiterten ascii-Tabelle und nicht 233.
Ich verstehe, dass erweiterte ascii-codes enthält "zwei Zeichen" aber ich verstehe nicht, wie das problem zu lösen mit dictionnary ?
Vielen Dank im Voraus !
🙂
Erweiterte Ascii ist das Zeichen im Bereich 128 und höher. Ascii = 0-127, Erweiterte Ascii = 128-255. Dies geht zurück auf die 60er und 70er Jahre. Nun ist es nicht wichtig, außer für seine restlichen Effekte, wie wenn Sie nicht drucken kann aus Zeichen oberhalb 128, aber Sie können für weniger als 128. Stammt dumb-terminals.
InformationsquelleAutor lilawood | 2011-12-11
Du musst angemeldet sein, um einen Kommentar abzugeben.
Verwenden
unichr
stattchr
. Die Funktionchr
erzeugt einen string, der ein einzelnes byte, in der Erwägung, dassunichr
erzeugt einen string, der ein einzelnes unicode-Zeichen. Schließlich tun suchen unter Verwendung von unicode-Zeichen zu:d[u'é']
weild['é']
den utf-8-Codierung von é.Haben Sie 3 Dinge, die zu deinem code: ein latin-1 kodiert str, " utf-8 codiert str und unicode-string. Immer klar in Ihrem Kopf, die Sie haben zu jedem Zeitpunkt erfordert viel wissen darüber, wie Python funktioniert und ein gutes Verständnis von Unicode und encodings.
Keine Antwort über Kodierungen und Unicode ist komplett ohne einen link zu Joel Spolsky ' s Artikel über die Frage: Das Absolute Minimum Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets (No Excuses!)
Danke Fred, behoben!
vielen Dank für Ihre Antwort. Ich habe installiert Python ist3 und es funktioniert perfekt 🙂
InformationsquelleAutor