Sollte ich 'has_key()' oder 'in' in Python-dicts?

Frage ich mich was besser ist zu tun:

d = {'a': 1, 'b': 2}
'a' in d
True

oder:

d = {'a': 1, 'b': 2}
d.has_key('a')
True

InformationsquelleAutor igorgue | 2009-08-24

dictionary python

1172

in ist definitiv mehr pythonic.

In der Tat has_key() wurde entfernt in Python 3.x.
- Als Ergänzung, in Python 3 zu prüfen, die Existenz in Werte, statt die Tasten, versuchen, >>> 1 in d....Werte()
- Eine semi-gotcha zu vermeiden, obwohl, ist, um sicherzustellen, dass Sie tun: "Schlüssel in some_dict" statt " - Taste in some_dict.keys()". Beide sind semantisch äquivalent, aber leistungsmäßig letzteres ist viel langsamer (O(n) vs O(1)). Ich habe gesehen, Menschen tun das "in dict.keys()" denken, es ist mehr explizite & daher besser.
- in arbeitet mit 2.6 zu Recht?
- ja, es funktioniert
- Ich habe gezeigt, Ihr Kommentar in meiner Antwort stackoverflow.com/a/41390975/117471
- In Python 3, keys() ist nur ein Satz-wie der Blick in ein Wörterbuch eher als eine Kopie, so x in d.keys() ist O(1). Dennoch x in d ist mehr Pythonic.
- interessant, also warum ist x in d.keys() so viel langsamer als x in d? (siehe die andere Antwort von @BrunoBronosky mit timeit läuft) Du hast Recht, obwohl es nicht angezeigt zu werden O(1), aber einen höheren Konstanten Faktor (ich sehe über 0.0361 vs 0.133 usec zwischen den beiden tut das timeit lokal testen, unabhängig davon, dict Größe in Python 3.7)
- Interessant, ich hatte nicht gesehen, dass. Ich nehme an, es ist, weil x in d.keys() müssen konstruieren und zu zerstören ein temporäres Objekt, komplett mit der Zuweisung von Speicher, bringt, wo x in d.keys() ist nur tun, eine arithmetische operation (Berechnung des hash) und macht einen lookup. Beachten Sie, dass d.keys() ist nur etwa 10 mal so lang als dieses, die ist noch nicht wirklich lange. Ich habe nicht überprüft, aber ich bin immer noch ziemlich sicher, dass es nur O(1).
InformationsquelleAutor tonfa
247

in gewinnt die Hände nach unten, nicht nur in der Eleganz (und nicht veraltet;-) aber auch in der Leistung, z.B.:
```
$ python -mtimeit -s'd=dict.fromkeys(range(99))' '12 in d'
10000000 loops, best of 3: 0.0983 usec per loop
$ python -mtimeit -s'd=dict.fromkeys(range(99))' 'd.has_key(12)'
1000000 loops, best of 3: 0.21 usec per loop
```
Während die folgende Beobachtung ist nicht immer wahr, Sie werden feststellen, dass in der Regel, in Python, die schnellere Lösung ist mehr elegant und Pythonic; das ist, warum -mtimeit SO hilfreich ist-es ist nicht nur über das speichern von hundert Nanosekunden hier und dort!-)
- Vielen Dank für diese, aus der überprüfung, dass "in some_dict" ist in der Tat O(1) viel einfacher (erhöhen Sie die 99 zu sagen 1999, und Sie finden die Laufzeit ist ungefähr das gleiche).
- has_key erscheint O(1) zu.
InformationsquelleAutor Alex Martelli
88

Nach python docs:

has_key() ist veraltet, zu Gunsten von
key in d.

InformationsquelleAutor Nadia Alramli
39

Verwenden dict.has_key() wenn (und nur wenn) Ihr code wird benötigt, um lauffähig von Python-Versionen älter als 2.3 (wenn key in dict eingeführt wurde).
- Die WebSphere-update in 2013 nutzt Jython 2.1 als seine wichtigste Skriptsprache. So ist das leider immer noch eine nützliche Sache zu beachten ist, fünf Jahre, nachdem Sie bemerkt es.
InformationsquelleAutor John Machin
22

Es ist ein Beispiel, wo in eigentlich tötet Ihre Leistung.

Wenn Sie in auf einer O(1) Behälter, die nur implementiert __getitem__ und has_key() aber nicht __contains__ Sie verwandeln eine O(1) Suche in O(N) Suche (wie in fällt zurück auf eine lineare Suche über __getitem__).

Fix ist natürlich trivial:
```
def __contains__(self, x):
    return self.has_key(x)
```
- Diese Antwort war anwendbar, wenn es veröffentlicht wurde, aber zu 99,95% der Leser können ihn getrost ignorieren. In die meisten Fällen, wenn Sie arbeiten, etwas mit diesem obskuren du wirst es wissen.
- Das ist wirklich kein Problem. has_key() ist speziell für Python 2 Wörterbücher. in / __contains__ ist die richtige API zu verwenden; für solche Behälter, wo ein vollständiger scan ist unvermeidlich, es gibt keine has_key() Methode trotzdem, und wenn es eine O(1) - Ansatz wählen, dann werden use-case spezifische und so dem Entwickler wählen Sie den richtigen Datentyp für das problem.
InformationsquelleAutor schlenk
15

has_key einem dictionary-Methode, aber in werden arbeiten an der Kollektion, und selbst wenn __contains__ fehlt, in verwenden eine andere Methode zum Durchlaufen der Auflistung zu finden.
- Und funktioniert auf Iteratoren "x in xrange(90, 200) <=> 90 <= x < 200"
- ...: Das sieht aus wie eine sehr schlechte Idee: 50 Operationen statt 2.
- In Python 3, es ist eigentlich ziemlich effizient zu tun in tests auf range Objekte. Ich bin nicht so sicher über seine Effizienz auf Python 2 xrange, obwohl. 😉
- nicht in Python 3; __contains__ können trivial berechnen, wenn ein Wert in dem Bereich oder nicht.
- Nicht unbedingt. Versuchen 1.0 in range(10**2, 0, -1) und dann versuchen 1.0 in range(10**10, 0, -1)
- Ich denke, dass Sie falsch verstanden, mein Kommentar. Ich bin der Antwort auf die erste Bemerkung, die verwendet x in xrange(…), das ist eindeutig kein Python ist3 und deutlich eine schlechte Idee.
- ja, Sie sind mit xrange aber während eine Menge Leute wissen das zu übersetzen, um range() in Python 3 nicht jeder ist sich bewusst, dass es range() containment-Test ist viel effizienter.
InformationsquelleAutor u0b34a0f6ae
14

Lösung dict.has_key() ist veraltet, verwenden Sie 'in' -- sublime text editor 3

Hier habe ich ein Beispiel-Wörterbuch mit dem Namen 'Alter' -
```
ages = {}

# Add a couple of names to the dictionary
ages['Sue'] = 23

ages['Peter'] = 19

ages['Andrew'] = 78

ages['Karren'] = 45

# use of 'in' in if condition instead of function_name.has_key(key-name).
if 'Sue' in ages:

    print "Sue is in the dictionary. She is", ages['Sue'], "years old"

else:

    print "Sue is not in the dictionary"
```
- Korrekt, aber es wurde schon beantwortet, willkommen Stackoveflow, vielen Dank für das Beispiel, überprüfen Sie immer die Antworten, aber!
- im nicht sicher, über die downvotes zu Ihr. Ihre Antwort könnte ähnlich wie die, die schon beantwortet wurden, aber Sie liefert ein Beispiel. Ist das nicht würdig genug, um eine Antwort SO?
- Nein: die Frage hatte schon ein Beispiel.
InformationsquelleAutor Greena modi

Erweiterung auf Alex Martelli ' s performance-tests mit Adam Parkin-Kommentare...

$ python3.5 -mtimeit -s'd=dict.fromkeys(range( 99))' 'd.has_key(12)'
Traceback (most recent call last):
  File "/usr/local/Cellar/python3/3.5.2_3/Frameworks/Python.framework/Versions/3.5/lib/python3.5/timeit.py", line 301, in main
    x = t.timeit(number)
  File "/usr/local/Cellar/python3/3.5.2_3/Frameworks/Python.framework/Versions/3.5/lib/python3.5/timeit.py", line 178, in timeit
    timing = self.inner(it, self.timer)
  File "<timeit-src>", line 6, in inner
    d.has_key(12)
AttributeError: 'dict' object has no attribute 'has_key'

$ python2.7 -mtimeit -s'd=dict.fromkeys(range(  99))' 'd.has_key(12)'
10000000 loops, best of 3: 0.0872 usec per loop

$ python2.7 -mtimeit -s'd=dict.fromkeys(range(1999))' 'd.has_key(12)'
10000000 loops, best of 3: 0.0858 usec per loop

$ python3.5 -mtimeit -s'd=dict.fromkeys(range(  99))' '12 in d'
10000000 loops, best of 3: 0.031 usec per loop

$ python3.5 -mtimeit -s'd=dict.fromkeys(range(1999))' '12 in d'
10000000 loops, best of 3: 0.033 usec per loop

$ python3.5 -mtimeit -s'd=dict.fromkeys(range(  99))' '12 in d.keys()'
10000000 loops, best of 3: 0.115 usec per loop

$ python3.5 -mtimeit -s'd=dict.fromkeys(range(1999))' '12 in d.keys()'
10000000 loops, best of 3: 0.117 usec per loop

Wunderbare Statistiken, manchmal implizite könnte besser sein als das explizite (zumindest in der Effizienz)...
Danke, @varun. Ich hatte vergessen, über diese Antwort. Ich brauche zu tun diese Art von Tests öfter. Ich regelmäßig Lesen, lange threads, wo sich Leute streiten sich über die Der Beste Weg,™, um Dinge zu tun. Aber ich habe selten daran erinnern, wie einfach es war, um proof.

InformationsquelleAutor Bruno Bronosky

0

Wenn Sie so etwas wie dieses
```
t.has_key(ew)
```
ändern Sie unten läuft auf Python 3.X und höher
```
key = ew
if key not in t
```
- Nein, Sie invertiert den test. t.has_key(ew) zurück True wenn der Wert ew Referenzen ist auch ein Schlüssel im dictionary. key not in t zurück True wenn der Wert nicht im Wörterbuch. Außerdem, die key = ew alias ist sehr, sehr überflüssig. Die richtige Schreibweise ist if ew in t. Was die akzeptierte Antwort von 8 Jahren vor dir schon gesagt.
InformationsquelleAutor Harshita Jhavar

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.