Gewusst wie: abrufen von python dict, wo der Schlüssel ist nur zum Teil bekannt ist?

Ich habe eine dict dass hat den Typ string-Schlüssel, deren genaue Werte kann ich nicht wissen (weil Sie dynamisch erzeugt an anderer Stelle). Allerdings weiß ich, dass das der Schlüssel, ich will mit einer bestimmten Teilstring, und dass eine einzelne Taste, die mit dieser unterzeichenfolge ist auf jeden Fall im dict.

Was ist das beste, oder "die meisten pythonic" Weg, um den Wert für diesen Schlüssel?

Dachte ich an zwei Strategien, die jedoch beide irk mir:

for k,v in some_dict.items():
    if 'substring' in k:
        value = v
        break

-- ODER --

value = [v for (k,v) in some_dict.items() if 'substring' in k][0]

Die erste Methode ist sperrig und etwas hässlich, während der zweite Reiniger ist, aber der zusätzliche Schritt der Indizierung in der Liste das Verständnis (die [0]) ärgert mich. Gibt es einen besseren Weg, um auszudrücken, die zweite version, oder einen kürzeren Weg zu schreiben, den ersten?

Beide schauen ziemlich präzise als im Vergleich zu den meisten anderen Sprachen. Aber ich denke der erste ist besser lesbar.
Warum wissen Sie über die substring? Gibt es irgendeine weitere information finden Sie? Könnten Sie tun, eine Art parsing/transformation auf die dict? Sie werden tun eine Menge der ähnliche Suchvorgänge auf der gleichen dict?
Sie sollten versuchen k.startswith('substring') oder k.endswith('substring') wenn es am Anfang oder am Ende; Sie können schneller sein.
(Karl ist ganz diskret versuchen, um Sie zu erwägen, mit einer anderen Datenstruktur, indem er über Ihre Anforderungen! Wie höflich und gut formuliert :)).
Wenn das lookup-alle was Sie some_dict denn dann ist es völlig nutzlos und eine Liste wäre besser. Wenn Sie eine Liste von Teilstrings, die Sie wollen, zu entsprechen, haben Sie eine Zeit-Komplexität von O(N**2). Brauchen Sie einen index über die Tasten um dies zu tun, effizient, obwohl, Volltext-Suchmaschinen wie Sphinx zu tun, dass im Grunde.
first method is bulky and somewhat ugly, while the second is cleaner kleinen Kommentar hier: zweite ist auch nicht sauberer, es hat nur weniger \n Zeichen. Es gibt einige seltsame überzeugung, dass single-Liner arbeiten schneller und sind besser lesbar. Sie sind es nicht.
Das dictionary (hashtable) Daten Struktur ist wirklich bedeutete für die genaue Schlüssel match: es macht nicht das partial-Schlüsselwort, passen gut zu allen, und zu versuchen, es zu biegen, zu tun, so ist gegen seine Maserung. Wie viele Einträge sind Sie auf der Suche vor?
Ich weiß über die substring-da der code, der Sie erzeugt (@Jochen, die code-Bibliothek kann ich nicht kontrollieren) tut dies in besonderer Weise, dass die Blätter am Ende der Zeichenfolge die gleiche, aber der Anfang ist immer anders. Ich könnte diese Fahrt uns mit einem endswith nennen, also danke für die Idee @agf. @Jakub ich finde, die Liste Verstehens sind sehr sauber und gut lesbar, aber das ist meine subjektive Meinung. @Paolo fortunely es nur 1 jetzt, aber es könnte eine Handvoll, sobald ich mehr schreiben-handling-code.
Aber wo ist "der Teilstring" kommen? Was ist der Zweck generieren, mit dem andere strings dynamisch? @Asymptote, gut erkannt, aber "unterschiedliche Daten-Struktur" ist wohl zu spezifisch 😉

InformationsquelleAutor coredumperror | 2011-08-13

10

Gibt es eine option zu schreiben, die zweite version mit der performance-Attribute der ersten.

Verwenden generator-Ausdruck anstelle von list comprehension:
```
value = next(v for (k,v) in some_dict.iteritems() if 'substring' in k)
```
Den Ausdruck innerhalb der Klammer gibt einen iterator, die Sie dann bitten, um die nächste, d.h. erstes element. Keine weiteren Elemente verarbeitet werden.
- Auf jeden Fall nutzen iteritems auf Python 2; ansonsten ist dies meine bevorzugte Methode.
- vielen Dank für das abfangen der Fehler. Mit items() würde überhaupt keinen Sinn machen, eigentlich.
- Das ist ein netter trick. Ich wäre versucht zu schreiben first = next irgendwo zu machen, es Lesen noch mehr klar... obwohl die first = next Linie selbst wäre irgendwie ein WTF ich nehme an o_O
- ich musste laut lachen. Haben Sie ein separates Konto, das Sie verwenden, während Sie nicht zu Hause? Warum?
- Ich bin paranoid, über die Verwendung von alles, was ich brauche ein login für, wenn Sie nicht auf meinem eigenen computer. Dies ist also nur eine temporäre ID, nicht einmal registriert. Wahrscheinlich keine sorgen machen, aber Sie wissen nie wirklich.... Auch ich bin nicht ganz sicher, welches Passwort ich verwende für SO, ich denke, es könnte eine zufällig generierte... überprüfen sollte, meine Notizen, wenn ich nach Hause komme >_<
- 121 rep für nicht eingetragene Konto? Es müssen Aufzeichnungen für den Namen, nicht eingetragene oder nicht.
- Knechtel: Das ist eine gefährliche Idee. Sich vorstellen, was passiert, wenn first genannt wird, mehrmals auf dem gleichen iterator, z.B. it = range(10); first2 = first(v) + first(v)
- für wie lange halten Sie eine Registerkarte öffnen und mit der Website verbunden, denke ich...
- Ich denke, das ist eine "Doktor, es tut weh" Art der Ausgabe Simon 🙂
- Dies ist genau die Art von Lösung, die ich suchte. Ich kannte generator-Ausdrücke, aber nicht wissen, könnten Sie phrase verwenden, die für dieses problem wirklich so aus.
InformationsquelleAutor blubb
1

Wie wäre es damit:
```
value = (v for (k,v) in some_dict.iteritems() if 'substring' in k).next()
```
Wird es sofort stoppen, wenn es findet das erste match.

Aber es hat immer noch O(n) Komplexität, wobei n die Anzahl der Schlüssel-Wert-Paare. Benötigen Sie etwas, das wie ein suffix-Liste oder einem suffix-Baum die Suche beschleunigt.
- Dies ist etwas, was ich als, aber ich persönlich finde es "hässlich" als die list-comprehension, die ich vorgeführt habe. Simon, die Antwort löst die Hässlichkeit problem, aber du hast Recht, dass diese Lösung besser ist als die, die ich vorgestellt, zumindest in Bezug auf die Leistung.
- Die Kostenlose next Funktion kann auch verwendet werden, um geben Sie einen Standardwert, der zurückgegeben wird, wenn der .next() ruft der iterator wirft StopIteration.
InformationsquelleAutor wks
1

Wenn es gibt viele Schlüssel, aber der string ist leicht zu rekonstruieren, aus der die unterzeichenfolge, dann kann es schneller zu rekonstruieren. z.B. oft kennen Sie die start-Taste, nicht aber die Zeitstempel, die angehängt wurde, auf. (so können Sie nur versuchen, 365 Terminen statt Durchlaufen Millionen von keys für das Beispiel).
Es ist unwahrscheinlich, dass der Fall zu sein, aber ich dachte, ich würde vorschlagen es auf jeden Fall.
z.B.
```
>>> names={'bob_k':32,'james_r':443,'sarah_p':12}
>>> firstname='james' #you know the substring james because you have a list of firstnames
>>> for c in "abcdefghijklmnopqrstuvwxyz":
...     name="%s_%s"%(firstname,c)
...     if name in names:
...             print name
... 
james_r
```
- Zum Glück habe ich nicht ganz so riesig von a dict, dass diese Art der Strategie erforderlich wäre, aber Sie ist eine neue Idee, daran hatte ich nicht gedacht. +1
InformationsquelleAutor robert king

class MyDict(dict):
    def __init__(self, *kwargs):
        dict.__init__(self, *kwargs)

    def __getitem__(self,x):
        return next(v for (k,v) in self.iteritems() if x in k)



# Defining several dicos ----------------------------------------------------    
some_dict = {'abc4589':4578,'abc7812':798,'kjuy45763':1002}

another_dict = {'boumboum14':'WSZE x478',
                'tagada4783':'ocean11',
                'maracuna102455':None}

still_another = {12:'jfg',45:'klsjgf'}



# Selecting the dicos whose __getitem__ method will be changed -------------       
name,obj = None,None
selected_dicos = [ (name,obj) for (name,obj) in globals().iteritems()
                   if type(obj)==dict
                   and all(type(x)==str for x in obj.iterkeys())]

print 'names of selected_dicos ==',[ name for (name,obj) in selected_dicos] 



# Transforming the selected dicos in instances of class MyDict -----------
for k,v in selected_dicos:
    globals()[k] = MyDict(v)



# Exemple of getting a value ---------------------------------------------      
print "some_dict['7812'] ==",some_dict['7812']

Ergebnis

names of selected_dicos == ['another_dict', 'some_dict']
some_dict['7812'] == 798

Was nicht bitte an die downvoter in meine Antwort ?? SO sollten nicht zulassen, downvotes ohne Kommentar
Mikians Danke, aber ich möchte noch mehr verstehen, was vorgeworfen wird meine Antwort
Ich denke, das ist eine ziemlich interessante Idee, aber Sie waren ein wenig Ausführlicher als nötig. Ich bin ziemlich sicher, dass die Festlegung des __init__ Funktion für MyDict ist überflüssig, da MyDict verwenden dict ist __init__ wenn es nicht eine eigene. Da deine Lösung nutzt die gleiche grundlegende Antwort wie Simon ' s, ich denke, es hat Verdienst, für jeden, der gerne eine kompliziertere Lösung, um ein problem wie dieses.
Diese Antwort im Grunde dauert der einfache Ansatz und etwas zweifelnd wickelt es in eine Klasse, dann zeigt eine Reihe von vorformulierten Verwendung einer Klasse, deren Verwendung sollte selbsterklärend sein, mit dem, was normalerweise als ziemlich tief Magie, um zu transformieren einem dict vorhanden. Oh, und es gibt eine Liste Verständnis, das dann direkt zugeführt, um eine for-Schleife, wo es einfacher gewesen wäre, einfach nur loop direkt, und die Entscheidung, welche dicts wrap basiert auf explizite Typprüfung (verpönt in der Regel). Kurz gesagt, das ist furchtbar un-Pythonic.

InformationsquelleAutor eyquem

0

Ich bevorzuge die erste version, obwohl ich es benutzen würde some_dict.iteritems() (wenn du auf Python 2), weil dann brauchen Sie sich nicht um die Erstellung einer kompletten Liste aller Artikel, die vorher. Stattdessen Durchlaufen die dict und brechen, sobald Sie fertig sind.

Auf Python 3, some_dict.items(2) bereits Ergebnisse in einem Wörterbuch anzeigen, also das ist schon einen passenden iterator.

InformationsquelleAutor Tim Pietzcker

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.