Tag: information-extraction

Informationsextraktion (IE) ist die Aufgabe automatisch extrahieren von strukturierten Informationen aus unstrukturierten und/oder semi-strukturierter maschinenlesbarer Dokumente. In den meisten Fällen ist diese Aktivität betrifft die Verarbeitung der menschlichen Sprache, Texten mittels natural language processing (NLP). Die jüngsten Aktivitäten in multimedia-Dokumenten-Verarbeitung wie bei der automatischen annotation und content-Extraktion aus Bildern/audio/video könnte man als information extraction.

Beispiel python-Skript, dass verwendet DBPedia?

Anzahl der Antworten 2 Antworten
Ich Schreibe ein python-Skript zum extrahieren von "Entity names" aus einer Sammlung von tausenden von news-Artikel von vor ein paar Länder und Sprachen. Möchte ich Gebrauch machen von der erstaunlichen DBPedia strukturierte knwoledge, sagen wir zum Beispiel,

Was ist der Unterschied zwischen Informationsextraktion und Text Mining?

Anzahl der Antworten 2 Antworten
Kann es sein, Suche einfach. Aber ich bin verwirrt. Was ist der Unterschied zwischen Text Mining und Information Extraction ? es schauen, wie Philosophie-Frage und es gibt eine Menge von Antworten in google. Gut gesagt... @Borys einverstanden

extrahieren Sie einzelne Zeichenfolge von HTML mit Ruby/Mechanize (und Nokogiri)

Anzahl der Antworten 2 Antworten
Ich bin extrahieren von Daten aus einem forum. Mein Skript basierend auf ist in Ordnung. Jetzt muss ich extrahieren von Datum und Uhrzeit (21 Dez 2009, 20:39) aus einzelnen Beitrag. Ich kann es nicht arbeiten. Ich verwendet

Hidden Markov Modelle-Paket in R

Anzahl der Antworten 4 Antworten
Brauche ich etwas Hilfe, Implementierung eines HMM-Modul in R. ich bin neu in R und nicht eine Menge wissen auf. So habe ich die Implementierung einer IE mit HMM, ich habe 2 Ordner mit Dateien, eine mit

Media-Informationen Extraktor für Java

Anzahl der Antworten 5 Antworten
Brauche ich einen media-information extraction-Bibliothek (Java oder JNI-wrapper) und kann mit gängigen Medien-Formate. Ich hauptsächlich benutze es für video-Dateien und ich brauche mindestens die folgenden Informationen: Video-Länge (Laufzeit) Video-bitrate Video framerate - Video-format-und codec - Video-Größe (Breite

Erweiterte PDF-Parsen Mit Python (extrahieren von text ohne Tabellen, etc): Was ist die Beste Bibliothek?

Anzahl der Antworten 2 Antworten
Ich bin auf der Suche nach einer PDF-Bibliothek, die es mir ermöglichen, zu extrahieren Sie den text aus einem PDF-Dokument. Ich habe PyPDF, und dies kann extrahieren Sie den text aus einem PDF-Dokument, sehr schön. Das problem

Wie findet Apple Daten, Zeiten und Adressen in E-Mails?

Anzahl der Antworten 6 Antworten
In der iOS-Mail-client, wenn Sie eine E-Mail enthält ein Datum, eine Zeit oder einen Ort ein, der text wird zu einem hyperlink, und es ist möglich, erstellen Sie einen Termin oder schauen Sie auf eine map einfach

Was ist das CoNLL-Datenformat?

Anzahl der Antworten 1 Antworten
Ich bin neu text mining. Ich bin mit einem open-source-jar (Mate-Parser), die gibt mir die Ausgabe in eine CoNLL 2009 format nach dependency parsing. Ich will das dependency parsing-Ergebnisse für die Extraktion von Informationen. Aber ich bin