Tag: word-frequency
Wort-Frequenz-Analyse der Frequenzen der unterschiedlichen Wörter in einem gegebenen Textkorpus oder eine generalisierte text.
2
Antworten
Habe ich ein python-code für word frequency count in einer text-Datei. Das problem mit dem Programm ist, dass es dauert fullstop berücksichtigen daher die änderung der Zählung. Für die Zählung Wort, das ich verwendet habe, eine sortierte
7
Antworten
Ich bin ein nicht-informatik-Studenten zu tun eine Geschichte these beinhaltet, dass die Bestimmung der Häufigkeit bestimmter Begriffe in einer Reihe von Texten, und dann Plotten Sie diese Frequenzen über die Zeit zu bestimmen, Veränderungen und trends. Ich
1
Antworten
Ich konvertieren möchten, diese matrix in ein pandas dataframe. csc_matrix Den ersten Zahl in der Klammer sollte die index, die zweiten Zahl Spalten und die Zahl am Ende die Daten. Ich tun möchte, zu tun, feature selection
3
Antworten
Ich bin Parsen eine lange Zeichenfolge von text und die Berechnung der Anzahl der Zeiten, die jedes Wort tritt in Python. Ich habe eine Funktion, die funktioniert, aber ich bin auf der Suche nach Beratung, ob es
3
Antworten
Habe ich die folgende matrix, die ich glaube, ist spärlich. Ich habe versucht, die Umwandlung zu dicht mit dem x.Dichte-format, aber es hat noch nie funktioniert. Irgendwelche Vorschläge, wie dies zu tun?, danke. mx=[[(0, 2), (1, 1),
4
Antworten
Gibt es ein Verzeichnis mit ein paar text-Dateien. Wie zähle ich die Häufigkeit der jedes Wort in jeder Datei? Ein Wort bedeutet eine Reihe von Zeichen, die Buchstaben, die Ziffern und die Unterstreichung von Zeichen. Was versuchen
3
Antworten
Kann mir jemand helfen, Suche das Wort Häufigkeit in allen lucene-index zum Beispiel, wenn doc A 3 Anzahl der Wort (B) und doc C hat 2 davon, ich möchte eine Methode zum zurückgeben 5 zeigt die Häufigkeit
3
Antworten
Hab ich die Frage von hier mit meinen änderungen. Ich habe folgenden code: from nltk.corpus import stopwords >>> def content_text(text): stopwords = nltk.corpus.stopwords.words('english') content = [w for w in text if w.lower() in stopwords] return content Wie
2
Antworten
Ich habe einen Datensatz mit 1000 Elemente und Ihre jeweiligen frquencies. ich brauche zum zeichnen eines Histogramms der top-10 vorkommenden Elemente. ich habe: top_words = Counter(my_data).most_common() top_words_10 = top_words[:10] plt.hist(top_words_10,label='True') und bekam diese Fehlermeldung : TypeError Traceback
10
Antworten
Ich zähle die Wort-Frequenz in einem text mit python. Ich dachte, das halten die Wörter in einem Wörterbuch und eine Zählung für jedes dieser Wörter. Nun, wenn ich auf Sortieren Sie die Wörter nach Anzahl der vorkommen.
6
Antworten
Habe ich mit dem tm-Paket um einige text-Analyse. Mein problem ist mit der Erstellung einer Liste mit Wörtern und Ihren Häufigkeiten im Zusammenhang mit der gleichen library(tm) library(RWeka) txt <- read.csv("HW.csv",header=T) df <- do.call("rbind", lapply(txt, as.data.frame)) names(df)
7
Antworten
Ohne Abschluss in information retrieval, ich würde gerne wissen, wenn es keine algorithmen zum zählen der Häufigkeit, mit der Wörter vorkommen in einem bestimmten text. Das Ziel ist es, ein "Gefühl" von dem, was die Leute sagen
19
Antworten
Eingabe: Eine positive ganze Zahl K und ein großer text. Der text kann tatsächlich gesehen werden, als word-Sequenz. So haben wir nicht zu befürchten, wie Sie brechen es in word-Sequenz. Ausgabe: Die häufigsten K Worte in den