einfach Klasse der text-Klassifikation in weka?
Ich ein Trainings-Datensatz (text) für eine bestimmte Kategorie (z.B. Krebs). Ich will trainieren, SVM Klassifizierer, die für diese Klasse in weka. Aber wenn ich versuche, dies zu tun, indem Sie einen Ordner "Krebs" und setzen alle diejenigen, die Ausbildung-Dateien auf den Ordner und wenn ich code bekomme ich folgende Fehlermeldung:
weka.Klassifikatoren.Funktionen.SMO: Nicht verarbeiten können, einfach Klasse!
was ich will zu tun ist, wenn der Klassifikator findet ein Dokument zu 'Krebs', sagt er die Namen richtig Klasse und sobald ich fütterte ein nicht-Krebs-Dokument, es sollte etwas sagen wie 'unbekannt'.
Was muss ich tun, um dieses Verhalten?
Du musst angemeldet sein, um einen Kommentar abzugeben.
SMO-Algorithmus in der Weka macht nur binäre Klassifikation zwischen zwei Klassen. Sequential Minimal Optimization ist ein spezifischer Algorithmus für die Lösung einer SVM und der in Weka dieses eine grundlegende Implementierung dieses Algorithmus. Wenn Sie einige Beispiele, die für Krebs und einige, die nicht sind, dann wäre binäre, vielleicht haben Sie nicht beschriftet sind Sie richtig.
Jedoch, wenn Sie mit Trainingsdaten, die alle Beispiele von Krebs, und Sie wollen es Ihnen sagen, ob eine Zukunft Beispiel passt das Muster oder nicht, dann Sie versuchen zu tun, ist one-class-SVM, aka ausreißererkennung.
LibSVM in Weka verarbeiten kann one-class-svm. Im Gegensatz zu den Weka-SMO-Umsetzung, LibSVM ist ein eigenständiges Programm, das wurde angebunden in Weka und beinhaltet viele verschiedene Varianten des SVM. Dieser Beitrag auf die Wekalist erklärt, wie Sie mit LibSVM für diese in Weka.