Tag: document-classification

Dokument-Klassifizierung, ist der Akt der Zuordnung von Dokumenten aus einem gegebenen Satz von Dokumenten zu einem von einer Anzahl von Klassen, wobei diese Klassen sind a priori bekannt.

Wörterbuch zum download

Anzahl der Antworten 4 Antworten
Kann jemand bieten einen Vorschlag, wo Sie zu finden ein Wort aus dem Wörterbuch Liste mit Frequenz-Informationen? Ideal, die Quelle wäre Englisch Wörter der nordamerikanischen Sorte. mögliche Duplikate von Natürliche englische Sprache Wörter InformationsquelleAutor AlgoMan | 2010-11-20

Multiclass SVM-text-classification

Anzahl der Antworten 2 Antworten
Möchte ich classfy News-Daten und Trainingsdaten sind klassifiziert mit IPTC-subject code(Hierarchische Klassifizierung). In meinem Projekt sollte ich verwenden svm . Ich habe alles getan, was in der feature-Extraktion ,stemming,entfernen von stop-word ... Ich habe fast das Datei-format

scikit-learn TfidfVectorizer Bedeutung?

Anzahl der Antworten 3 Antworten
Ich war Lesung über TfidfVectorizer Umsetzung von scikit-learn, i dont verstehen, was die Ausgabe der Methode, zum Beispiel: new_docs = ['He watches basketball and baseball', 'Julie likes to play basketball', 'Jane loves to play baseball'] new_term_freq_matrix =

Basic text-Klassifikation mit Weka in Java

Anzahl der Antworten 3 Antworten
Ich versuche zu bauen, ein text-Klassifizierer in JAVA mit Weka. Ich habe einige tutorials, und Im Versuch, meine eigenen bauen classifier. Habe ich die folgenden Kategorien: computer,sport,unknown und die folgenden bereits ausgebildet Daten cs belongs to computer

Text-Klassifizierung/Kategorisierung-Algorithmus

Anzahl der Antworten 8 Antworten
Mein Ziel ist, [halb]automatische Zuweisung der Texte zu den verschiedenen Kategorien. Es gibt eine Reihe von benutzerdefinierten Kategorien, und eine Reihe von Texten, die für jede Kategorie. Der ideale Algorithmus sollte in der Lage sein, von einem