Wie funktioniert die removeSparseTerms in R arbeiten?

Ich bin mit dem removeSparseTerms-Methode in R, und es erforderlich, einen Schwellwert eingegeben werden. Ich habe auch gelesen, dass je höher der Wert, desto mehr wird die Anzahl der Begriffe, bleibt in der matrix zurückgegeben.

Wie funktioniert diese Methode funktioniert und was ist die Logik dahinter? Ich verstehe das Konzept der Kargheit aber hat diese Schwelle anzugeben, wie viele Dokumente sollte ein Begriff vorhanden sein, oder einige andere ratio, etc?

InformationsquelleAutor der Frage London guy | 2015-02-27

Schreibe einen Kommentar