Cosinusähnlichkeit und tf-idf

Ich bin verwirrt durch den folgenden Kommentar über TF-IDF und Kosinus-Ähnlichkeit.

War ich zu Lesen, bis auf die beiden und dann auf wiki unter Cosinus-Ähnlichkeit finde ich diesen Satz "Im Falle des information retrieval, der Kosinus-ähnlichkeit zweier Dokumente wird im Bereich von 0 bis 1, da der term-Frequenz (tf-idf-GEWICHTE) nicht negativ sein darf. Der Winkel zwischen zwei term-Frequenz-Vektoren kann nicht größer sein als 90°."

Nun Frage ich mich,....sind Sie das nicht 2 verschiedene Dinge?

Ist tf-idf bereits in der Kosinus-ähnlichkeit? Wenn ja, dann was soll ' s, ich kann nur sehen, das innere dot-Produkte und-euklidischen Längen.

Ich dachte, tf-idf war etwas, das Sie tun konnte vor läuft Kosinus-ähnlichkeit auf die Texte. Hab ich was verpasst?

InformationsquelleAutor der Frage N00programmer | 2011-06-06

Schreibe einen Kommentar