Datei-format für die Klassifikation mit SVM Licht
Ich versuche zu bauen, ein Klassifikator mit SVM Licht, die klassifiziert ein Dokument in einer der beiden Klassen. Ich habe schon trainiert und getestet, der Systematik und eine Modell-Datei ist auf der Festplatte gespeichert. Jetzt will ich mit diesem Modell-Datei zu klassifizieren vollständig neue Dokumente. Was sollte das format der Eingabedatei für diese? Könnte es sein, plain-text-Datei (ich glaube nicht, dass das funktionieren würde) oder könnte es einfach nur die Auflistung der Funktionen in der text-Datei ohne jegliche Klasse label und feature-GEWICHTE (in diesem Fall ich habe, um zu verfolgen die Indizes der features in feature-Vektor während der Ausbildung), oder ist es ein anderes format sein?
Du musst angemeldet sein, um einen Kommentar abzugeben.
Trainings-und Test-Dateien müssen das gleiche format haben, jede Instanz, die Ergebnisse in eine Zeile der folgenden form:
Beispiel (copy pasta von SVM^Licht website):
Können Sie sich die SVM^Licht website für weitere Informationen.
<feature>:<value>....<feature>:<value>
]? Für die Ausbildung bin ich mit dem tf-idf-als auch für die Klasse der Frequenz für die Berechnung dieser Wert berücksichtigt Gesamtzahl von Schulungsunterlagen sowie insgesamt die Anzahl der Trainingsdokumente in der Klasse, zu der dieses Dokument gehört. Für die Prüfung könnte das einen Wert berechnet, in einer Weise anders aus, die im training benutzt? Wenn ja, was könnte dieser Wert eventuell?Datei-format, um Vorhersagen zu treffen ist die gleiche wie die, um zu testen und zu trainieren, d.h.
Aber die Vorhersage das Ziel ist unknow, so Sie haben zu Verwendung der Wert 0 als Ziel. Thi ist der einzige Unterschied. Ich hoffe, dies hilft jemand