Wie man mehr Gewicht auf bestimmte Funktionen im maschinellen lernen?

Wenn eine Bibliothek, wie scikit-learn, wie ordne ich mehr Gewicht auf bestimmte features in der Eingabe zu einem classifier wie SVM? Ist das etwas, was Menschen tun oder gibt es eine andere Lösung für mein problem?

  • Warum würden Sie dies tun? Gute algorithmen mache das schon automatisch und situationnally.
  • Blick auf TF-IDF - es tut Gewichtung
  • tfidf nicht über die Gewichtung der Funktionen, es ist mehr über das "quetschen" zu schnell zu wachsen, so dass Sie bekommen angemessene Skalen. Es führt nicht auf eine bestimmte Funktion als "wichtiger", es sei denn, Sie verwenden sehr spezielle Klassifizierer auf der Oberseite (zum Beispiel für die Entscheidung, die Bäume, tfidf nicht von der "Bedeutung" an alle)
  • Was auch immer. Wenn die Anzahl der Instanzen und inverse Dokument-Frequenz ist nicht ein Gewicht dann, was es ist?
  • Es ist "nur" eine Vertretung, die kein Gewicht in dem Sinne, OP ist für Fragen. Classifier ist nicht "gezwungen", um den Fokus auf bestimmte Funktion, die aufgrund der Anzahl der vorkommen (Wert von tfidf). Es funktioniert wie ein Gewicht für einige Modelle, obwohl, wie beschrieben in der Antwort - Sie erfordert Klassifizierer zu bevorzugen, die hohe Werte von Funktionen, die nicht eine Allgemeine Eigenschaft von ML-Modellen.
InformationsquelleAutor 28r | 2016-06-26
Schreibe einen Kommentar