Vergleich von string und unicode in Python 2.7.5

Ich Frage mich, warum, wenn ich machen:

a = [u'k',u'ę',u'ą']

und geben Sie dann ein:

'k' in a

Bekomme ich True, während:

'ę' in a

mir False?

Es gibt mir wirklich Kopfschmerzen und es scheint, jemand hat das mit Absicht, um die Leute verrückt...

Für was es Wert ist, dieses sich so verhält, wie Sie erwarten, dass in Python 3.
Auf meinem Python (2.7.2), dies löst die Warnung UnicodeWarning: Unicode equal comparison failed to convert both arguments to Unicode - interpreting them as being unequal vor der Rückkehr False, das ist der Grund dafür. Mit u'ę' in a funktioniert wie erwartet.
Quelle?
Nur ich klebte es in mein Dolmetscher.
Hat der interpreter die Verarbeitung von unicode-Eingabe?
Ich bin mit python 2.7.15, 'ę' in a ist Wahr, das ist seltsam...

InformationsquelleAutor Kulawy Krul | 2013-11-14

13

Und warum ist das so?

In Python 2.x, das kann man nicht vergleichen unicode-string direkt für nicht-ascii-Zeichen. Dieser löst eine Warnung:
```
Warning (from warnings module):
  File "__main__", line 1
UnicodeWarning: Unicode equal comparison failed to convert both arguments to Unicode - interpreting them as being unequal
```
Jedoch in Python 3.x diese nicht angezeigt werden, da alle strings sind unicode-Objekte.

Lösung?

Können Sie entweder die Zeichenfolge unicode:
```
>>> u'ç' in a
True
```
Nun, Sie sind zu vergleichen die beiden unicode-Objekte keine unicode-string.

Oder konvertieren Sie beide zu einer Codierung, beispielsweise utf-8, bevor Sie den Vergleich:
```
>>> c = u"ç"
>>> u'ç'.encode('utf-8') == c.encode('utf-8')
True
```
Auch für die Verwendung von nicht-ascii-Zeichen in Ihrem Programm haben, müssen Sie die Kodierung angeben, die am Anfang der Datei:
```
# -*- coding: utf-8 -*-

#the whole program
```
Hoffe, das hilft!
- +1 für den letzten Absatz 😉
InformationsquelleAutor aIKid
4

Müssen Sie explizit als unicode-string. Die folgenden zeigt ein Beispiel, und die Warnung gegeben, wenn Sie nicht, geben Sie es als unicode:
```
>>> a = [u'k',u'ę',u'ą']
>>> 'k' in a
True
>>> 'ę' in a
__main__:1: UnicodeWarning: Unicode equal comparison failed to convert both arguments to Unicode - interpreting them as being unequal
False
>>> u'ę' in a
True
```
- Ja, ich weiß, aber wenn ich versuche zu schreiben: unicode('ę') alles stürzt ab...
- Siehe meine Antwort
InformationsquelleAutor jordanm
1

u'ę' ist ein unicode Objekt, während 'ę' ist ein str Objekt in Ihrer aktuellen Ländereinstellung. Manchmal, je nach Gebietsschema, Sie werden die gleichen sein, und manchmal werden Sie nicht.

Eines der schönen Dinge über Python 3 ist, dass der gesamte text ist in unicode, so dass dieses spezielle problem geht Weg.
- Scheint, dass ich brauchen, um mit Python 3, sofort! 🙂 Vielen Dank!
InformationsquelleAutor Ethan Furman
0

Stellen Sie sicher, dass Sie geben Sie die Quell-code-Codierung und verwenden u vor der unicode-Literale.

Diese funktioniert sowohl auf Python 3 und Python 2:
```
#!/usr/bin/python
# -*- coding: utf-8 -*-

a = [u'k',u'ę',u'ą']

print(u'ę' in a)
# True
```
InformationsquelleAutor dawg

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.