Gensim: KeyError: "Wort nicht im Vokabular"

Habe ich eine ausgebildete Word2vec Modell mit Python-Gensim-Bibliothek. Ich habe eine Token-Liste, wie unten. Die Vokabeln Größe ist 34, aber ich bin damit nur wenige von 34:

b = ['let',
 'know',
 'buy',
 'someth',
 'featur',
 'mashabl',
 'might',
 'earn',
 'affili',
 'commiss',
 'fifti',
 'year',
 'ago',
 'graduat',
 '21yearold',
 'dustin',
 'hoffman',
 'pull',
 'asid',
 'given',
 'one',
 'piec',
 'unsolicit',
 'advic',
 'percent',
 'buy']

Modell

model = gensim.models.Word2Vec(b,min_count=1,size=32)
print(model) 
### prints: Word2Vec(vocab=34, size=32, alpha=0.025) ####

wenn ich versuche die ähnlichkeit score by doing model['buy'] eines der Wörter in der Liste, bekomme ich die

KeyError: "Wort" kaufen "nicht im Vokabular"

Könnt Ihr mir empfehlen, was mache ich falsch und was sind die Möglichkeiten zum überprüfen des Modells, welche verwendet werden, um Zug PCA oder t-sne, um zu visualisieren, ähnliche Wörter bilden ein Thema? Danke.

InformationsquelleAutor Krishnang K Dalal | 2017-07-31

Schreibe einen Kommentar