Wie berechnet man die Satzähnlichkeit mit dem word2vec-Modell von Gensim mit Python?

Entsprechend der Gensim Word2Vec, ich kann die word2vec Modell im gensim-Paket zur Berechnung der ähnlichkeit zwischen 2 Worten.

z.B.

trained_model.similarity('woman', 'man') 
0.73723527

Jedoch die word2vec Modell nicht zur Vorhersage der Satz ähnlichkeit. Ich finde heraus, das LSI-Modell mit Satz ähnlichkeit im gensim, aber, die nicht scheinen, dass können kombiniert werden mit word2vec Modell. Die Länge des Korpus jeder Satz, den ich habe, ist nicht sehr lang (weniger als 10 Wörter). Also, gibt es irgendwelche einfachen Möglichkeiten, um das Ziel zu erreichen?

Kommentar zu dem Problem
Es ist ein ACL-tutorial über dieses Thema (unter anderem): youtube.com/watch?v=_ASOqXiWBVo&feature=youtu.werden Kommentarautor: Emiel
Sie können jetzt gensim ist doc2vec und erhalten Satz ähnlichkeit aus der gleichen Modul Kommentarautor: kampta

InformationsquelleAutor der Frage zhfkt | 2014-03-02

Schreibe einen Kommentar