Tag: document-classification
Dokument-Klassifizierung, ist der Akt der Zuordnung von Dokumenten aus einem gegebenen Satz von Dokumenten zu einem von einer Anzahl von Klassen, wobei diese Klassen sind a priori bekannt.
4
Antworten
Kann jemand bieten einen Vorschlag, wo Sie zu finden ein Wort aus dem Wörterbuch Liste mit Frequenz-Informationen? Ideal, die Quelle wäre Englisch Wörter der nordamerikanischen Sorte. mögliche Duplikate von Natürliche englische Sprache Wörter InformationsquelleAutor AlgoMan | 2010-11-20
2
Antworten
Möchte ich classfy News-Daten und Trainingsdaten sind klassifiziert mit IPTC-subject code(Hierarchische Klassifizierung). In meinem Projekt sollte ich verwenden svm . Ich habe alles getan, was in der feature-Extraktion ,stemming,entfernen von stop-word ... Ich habe fast das Datei-format
3
Antworten
Ich war Lesung über TfidfVectorizer Umsetzung von scikit-learn, i dont verstehen, was die Ausgabe der Methode, zum Beispiel: new_docs = ['He watches basketball and baseball', 'Julie likes to play basketball', 'Jane loves to play baseball'] new_term_freq_matrix =
3
Antworten
Ich versuche zu bauen, ein text-Klassifizierer in JAVA mit Weka. Ich habe einige tutorials, und Im Versuch, meine eigenen bauen classifier. Habe ich die folgenden Kategorien: computer,sport,unknown und die folgenden bereits ausgebildet Daten cs belongs to computer
8
Antworten
Mein Ziel ist, [halb]automatische Zuweisung der Texte zu den verschiedenen Kategorien. Es gibt eine Reihe von benutzerdefinierten Kategorien, und eine Reihe von Texten, die für jede Kategorie. Der ideale Algorithmus sollte in der Lage sein, von einem