Tag: lda

Latent Dirichlet Allocation, LDA, ist ein generatives Modell, das erlaubt, Gruppen von Beobachtungen erklärt werden unbeobachtet Gruppen, die erklären, warum einige Teile der Daten sind ähnlich.

Gensim ImportError in PyCharm: Kein Modul namens scipy.spärlich

Anzahl der Antworten 1 Antworten
Bin ich auf Mac OS X 10.8.3 (Mountain Lion) und bin versucht, ein Skript auszuführen, in PyCharm. Python 2.7.2 installiert ist, habe ich installiert Baldachin und Gensim. Ich verstehe einfach nicht, was könnte die Ursache der Fehlermeldung,

Wie, um Vorhersagen, die Thema einer neuen Abfrage, die einen ausgebildeten LDA-Modell mit gensim?

Anzahl der Antworten 3 Antworten
Ich ausgebildet haben, ein Korpus für die LDA Thema Modellierung mit gensim. Gehen Sie durch die Anleitung auf der gensim website (ist nicht der ganze code): question = 'Changelog generation from Github issues?'; temp = question.lower() for

AttributeError: '- Serie,' Objekt hat kein Attribut 'sort_values'

Anzahl der Antworten 2 Antworten
pyLDAvis Bibliothek prepare Methode ist abgestürzt, während mit pandas-Bibliothek im inneren. Hier ist der code: def load_R_model(filename): with open(filename, 'r') as j: data_input = json.load(j) data = {'topic_term_dists': data_input['phi'], 'doc_topic_dists': data_input['theta'], 'doc_lengths': data_input['doc.length'], 'vocab': data_input['vocab'], 'term_frequency': data_input['term.frequency']}

Lineare DISKRIMINANZANALYSE LDA in Matlab

Anzahl der Antworten 2 Antworten
Habe ich einen großen Datenbestand von multidimensionalen Daten(240 Abmessungen). Ich bin ein Anfänger bei der Durchführung von Daten-mining -, und ich möchte die Anwendung Linearer DISKRIMINANZANALYSE mithilfe von Matlab. Allerdings habe ich gesehen, dass es eine Menge

Gensim: Wie speichern LDA-Modell produziert Themen, um ein lesbares format (csv,txt,etc)?

Anzahl der Antworten 4 Antworten
letzten Teile des Codes: lda = LdaModel(corpus=corpus,id2word=dictionary, num_topics=2) print lda bash-Ausgang: INFO : adding document #0 to Dictionary(0 unique tokens) INFO : built Dictionary(18 unique tokens) from 5 documents (total 20 corpus positions) INFO : using serial

So drucken Sie den LDA-Themen-Modelle von gensim? Python

Anzahl der Antworten 8 Antworten
Mit gensim ich war in der Lage zu extrahieren Themen aus einem Satz von Dokumenten in LSA, aber wie kann ich den Zugriff auf die generierten Themen aus der LDA-Modelle? Beim drucken der lda.print_topics(10) dem code, gab

LDA mit topicmodels, wie kann ich sehen, welche Themen andere Dokumente gehören?

Anzahl der Antworten 3 Antworten
Ich bin mit LDA vom topicmodels Paket, und ich habe es auf über 30.000 Dokumente, hat 30 Themen, und bekam den top-10-Wörter für die Themen, Sie sehen sehr gut aus. Aber ich würde gerne sehen, welche Dokumente

Wie funktioniert die removeSparseTerms in R arbeiten?

Anzahl der Antworten 3 Antworten
Ich bin mit dem removeSparseTerms-Methode in R, und es erforderlich, einen Schwellwert eingegeben werden. Ich habe auch gelesen, dass je höher der Wert, desto mehr wird die Anzahl der Begriffe, bleibt in der matrix zurückgegeben. Wie funktioniert

Vorhersage LDA Themen für neue Daten

Anzahl der Antworten 1 Antworten
Wie es aussieht, hat diese Frage kann gefragt worden ein paar mal, bevor (hier und hier), aber es muss noch beantwortet werden. Ich hoffe, dies ist aufgrund der bisherigen Unklarheit der Frage(N) gebeten, als durch Kommentare gekennzeichnet.

Themenverteilung: Wie sehen wir, welches Dokument zu welchem ​​Thema gehört, nachdem LDA in Python ausgeführt wurde?

Anzahl der Antworten 2 Antworten
Ich bin in der Lage zu laufen, den LDA-code von gensim und bekam den top-10-Themen mit den jeweiligen keywords. Nun würde ich gerne einen Schritt weiter gehen, um zu sehen, wie genau die LDA-algo ist durch sehen,

Python Gensim: Wie berechnet man Dokumentähnlichkeit mit dem LDA-Modell?

Anzahl der Antworten 2 Antworten
Habe ich eine ausgebildete LDA-Modell, und ich will die Berechnung der similarity-score zwischen zwei Belege aus dem Korpus trainierte ich mein Modell auf. Nach dem Studium der alle Gensim-tutorials und Funktionen, ich kann immer noch nicht meinen

LDA Topic Modeling - Training und Testen

Anzahl der Antworten 1 Antworten
Habe ich gelesen, LDA, und ich verstehe die Mathematik, wie die Themen, die generiert werden, wenn einer der Eingänge eine Sammlung von Dokumenten. Referenzen sagen, dass die LDA ist ein Algorithmus, der, gegeben eine Sammlung von Dokumenten,

Entfernen Sie leere Dokumente aus DocumentTermMatrix in R topicmodels?

Anzahl der Antworten 5 Antworten
Ich mache das Thema Modellierung mit der topicmodels Paket in R. ich bin die Schaffung eines Corpus Objekt, dabei einige grundlegende Vorverarbeitung, und dann die Erstellung eines DocumentTermMatrix: corpus <- Corpus(VectorSource(vec), readerControl=list(language="en")) corpus <- tm_map(corpus, tolower) corpus