Tag: text-classification
Einfach die besagt, text-Klassifikation ist alles darum, ein Stück text in eine Reihe von (meist vordefinierten Kategorien. Dies ist eines der wichtigsten Probleme, das Auftritt, in vielen realen Anwendungen. Zum Beispiel ein Beispiel für die text-Klassifizierung wäre eine automatisierte call-Center, die Kategorisierung der Beschwerden, die automatisch in die entsprechenden Eimer Probleme.
4
Antworten
Ziel : Identifizierung Klasse label mit Benutzer eingegebene Frage (wie Frage Antwort system). Daten extrahiert, die von Großen PDF-Datei, und brauchen, um vorherzusagen, Seitenzahl basierend auf Benutzereingaben. Hauptsächlich verwendet in der policy-Dokument, wo Benutzer haben Fragen über
1
Antworten
Ich bin neu in Python und Stackoverflow(bitte sanft) und versuche zu lernen, wie eine sentiment-Analyse. Ich bin mit einer Kombination aus code fand ich in einem tutorial und hier: Python - AttributeError: 'list' - Objekt hat kein
2
Antworten
Gibt es irgendein Beispiel, wie kann TensorFlow benutzt werden, für text-Klassifikation mit neuronalen Netzen? Sumit gefragt, die Frage auf die Tensorflow github-Seite und mir wurde gesagt, hierher zu kommen. github.com/tensorflow/tensorflow/issues/215 Ich würde gerne sehen, ein Beispiel für
1
Antworten
Ich bin mit Scikit-learn für die text-Klassifizierung. Ich möchte berechnen, die Informationen Gewinnen, die für jedes Attribut mit Bezug auf eine Klasse in einer (spärlich) Dokument-term-matrix. Der Information Gain ist definiert als H(Class) - H(Klasse | Attribut),
3
Antworten
Ich habe ein eindimensionales array mit großen Zeichenfolgen in jedem der Elemente. Ich bin versucht, einen CountVectorizer zum umwandeln von text-Daten in numerische Vektoren. Allerdings bin ich immer die Fehlermeldung: AttributeError: 'numpy.ndarray' object has no attribute 'lower'
1
Antworten
Mache ich verschiedene text-Klassifikation von Experimenten. Jetzt brauche ich für die Berechnung der AUC-ROC für jede Aufgabe. Für die binäre Klassifikationen habe ich schon gemacht und es funktioniert mit diesem code: scaler = StandardScaler(with_mean=False) enc = LabelEncoder()
2
Antworten
Ich habe eine csv-struct ist CAT1,CAT2,TITLE,URL,CONTENT, CAT1, CAT2, TITEL ,die INHALTE sind in der chinesischen. Ich will trainieren LinearSVC oder MultinomialNB mit X(TITEL) und Funktion(CAT1,CAT2), bekommen beide diese Fehler. unten ist mein code: PS: ich Schreibe code
2
Antworten
Möchte ich hinzufügen, ein paar mehr Worte zu stop_words in TfidfVectorizer. Ich habe die Lösung in Hinzufügen von Wörtern zu scikit-learn ist CountVectorizer stop-Liste . Meine stop-word-Liste enthält nun sowohl "Englisch" stop-Wörter und die stop-Wörter, die ich
1
Antworten
Ich benutze Weka erfolgreich bauen, um einen Klassifikator. Ich würde jetzt gerne beurteilen, wie wirksam oder wichtig, meine Merkmale sind. Für diese verwende ich AttributeSelection. Aber ich weiß nicht, wie zu Ausgang der verschiedenen Funktionen, die mit
2
Antworten
Den text-Daten ist organisiert als Vektor mit 20.000 Elementen, wie [2, 1, 0, 0, 5, ...., 0]. i-te element gibt die Häufigkeit der i-te Wort in einem text. Den ground truth Daten für die Etikettierung ist auch