Tag: text-classification

Einfach die besagt, text-Klassifikation ist alles darum, ein Stück text in eine Reihe von (meist vordefinierten Kategorien. Dies ist eines der wichtigsten Probleme, das Auftritt, in vielen realen Anwendungen. Zum Beispiel ein Beispiel für die text-Klassifizierung wäre eine automatisierte call-Center, die Kategorisierung der Beschwerden, die automatisch in die entsprechenden Eimer Probleme.

Verhindern, über-Einbau von text-Klassifikation mit Word einbetten mit LSTM

4 Antworten

Ziel : Identifizierung Klasse label mit Benutzer eingegebene Frage (wie Frage Antwort system). Daten extrahiert, die von Großen PDF-Datei, und brauchen, um vorherzusagen, Seitenzahl basierend auf Benutzereingaben. Hauptsächlich verwendet in der policy-Dokument, wo Benutzer haben Fragen über

Python text processing: AttributeError: 'list' - Objekt hat kein Attribut 'untere'

1 Antworten

Ich bin neu in Python und Stackoverflow(bitte sanft) und versuche zu lernen, wie eine sentiment-Analyse. Ich bin mit einer Kombination aus code fand ich in einem tutorial und hier: Python - AttributeError: 'list' - Objekt hat kein

csv python text-classification

TensorFlow - Text-Klassifikation mit Neuronalen Netzen

2 Antworten

Gibt es irgendein Beispiel, wie kann TensorFlow benutzt werden, für text-Klassifikation mit neuronalen Netzen? Sumit gefragt, die Frage auf die Tensorflow github-Seite und mir wurde gesagt, hierher zu kommen. github.com/tensorflow/tensorflow/issues/215 Ich würde gerne sehen, ein Beispiel für

tensorflow text-classification

Information-Gain-Berechnung mit Scikit-learn

1 Antworten

Ich bin mit Scikit-learn für die text-Klassifizierung. Ich möchte berechnen, die Informationen Gewinnen, die für jedes Attribut mit Bezug auf eine Klasse in einer (spärlich) Dokument-term-matrix. Der Information Gain ist definiert als H(Class) - H(Klasse | Attribut),

feature-selection machine-learning python scikit-learn text-classification

CountVectorizer: AttributeError: 'numpy.ndarray' - Objekt hat kein Attribut 'untere'

3 Antworten

Ich habe ein eindimensionales array mit großen Zeichenfolgen in jedem der Elemente. Ich bin versucht, einen CountVectorizer zum umwandeln von text-Daten in numerische Vektoren. Allerdings bin ich immer die Fehlermeldung: AttributeError: 'numpy.ndarray' object has no attribute 'lower'

numpy python scikit-learn text-classification

Sklearn: ROC für multiclass Klassifizierung

1 Antworten

Mache ich verschiedene text-Klassifikation von Experimenten. Jetzt brauche ich für die Berechnung der AUC-ROC für jede Aufgabe. Für die binäre Klassifikationen habe ich schon gemacht und es funktioniert mit diesem code: scaler = StandardScaler(with_mean=False) enc = LabelEncoder()

multiclass-classification python roc scikit-learn text-classification

sklearn Klassifizierer erhalten ValueError: bad input Form

2 Antworten

Ich habe eine csv-struct ist CAT1,CAT2,TITLE,URL,CONTENT, CAT1, CAT2, TITEL ,die INHALTE sind in der chinesischen. Ich will trainieren LinearSVC oder MultinomialNB mit X(TITEL) und Funktion(CAT1,CAT2), bekommen beide diese Fehler. unten ist mein code: PS: ich Schreibe code

classification python scikit-learn text-classification

hinzufügen von Wörtern zu stop_words Liste in TfidfVectorizer in sklearn

2 Antworten

Möchte ich hinzufügen, ein paar mehr Worte zu stop_words in TfidfVectorizer. Ich habe die Lösung in Hinzufügen von Wörtern zu scikit-learn ist CountVectorizer stop-Liste . Meine stop-word-Liste enthält nun sowohl "Englisch" stop-Wörter und die stop-Wörter, die ich

classification python scikit-learn stop-words text-classification

Wie rank-Funktionen, indem Ihre Bedeutung in einem Weka-Klassifizierer?

1 Antworten

Ich benutze Weka erfolgreich bauen, um einen Klassifikator. Ich würde jetzt gerne beurteilen, wie wirksam oder wichtig, meine Merkmale sind. Für diese verwende ich AttributeSelection. Aber ich weiß nicht, wie zu Ausgang der verschiedenen Funktionen, die mit

feature-selection machine-learning nlp text-classification weka

Multilabel Text Klassifizierung mit TensorFlow

2 Antworten

Den text-Daten ist organisiert als Vektor mit 20.000 Elementen, wie [2, 1, 0, 0, 5, ...., 0]. i-te element gibt die Häufigkeit der i-te Wort in einem text. Den ground truth Daten für die Etikettierung ist auch

multilabel-classification python tensorflow text-classification