Wie zu beschleunigen Gensim Word2vec Modell laden Zeit?

Baue ich einen chatbot, also muss ich Vektorisieren die Eingabe des Benutzers mit Word2Vec.

Ich bin mit einem pre-trainierte Modell mit 3 Millionen Wörter, die von Google (GoogleNews-Vektoren-negative300).

So, ich lade das Modell mit Gensim:

import gensim
model = gensim.models.KeyedVectors.load_word2vec_format('GoogleNews-vectors-negative300.bin', binary=True)

Das problem ist, dass es dauert etwa 2 Minuten, um das Modell zu laden. Ich kann nicht zulassen, dass der Benutzer so lange warten.

Also, was kann ich tun zur Beschleunigung der Ladezeit?

Dachte ich über das setzen jedes der 3 Millionen Wörter und Ihre entsprechenden Vektor in eine MongoDB-Datenbank. Das würde sicherlich beschleunigt, aber die intuition sagt mir, es ist keine gute Idee.

InformationsquelleAutor Marcus Holm | 2017-03-23
Schreibe einen Kommentar