sklearn : TFIDF-Transformator : Wie man tf-idf-Werte der gegebenen Wörter im Dokument

Ich verwendet, sklearn für die Berechnung der TFIDF (Term frequency inverse document frequency) - Werte für Dokumente mit Befehl :

from sklearn.feature_extraction.text import CountVectorizer
count_vect = CountVectorizer()
X_train_counts = count_vect.fit_transform(documents)
from sklearn.feature_extraction.text import TfidfTransformer
tf_transformer = TfidfTransformer(use_idf=False).fit(X_train_counts)
X_train_tf = tf_transformer.transform(X_train_counts)

X_train_tf ist ein scipy.sparse matrix der Form (2257, 35788).

Wie kann ich die TF-IDF für die Wörter in einem bestimmten Dokument? Mehr spezifisch, wie man Wörter mit maximale TF-IDF Werte in einem bestimmten Dokument?

InformationsquelleAutor maximus | 2015-12-24
Schreibe einen Kommentar