Tag: text-parsing
Text-Analyse ist eine Variante der Analyse, die sich auf die Aktion zu brechen, ein Strom von text in unterschiedliche Komponenten und die Erfassung der Beziehung zwischen diesen Komponenten.
2
Antworten
Schrieb ich die folgenden kombinierten Grammatik: grammar KeywordGrammar; options{ TokenLabelType = MyToken; } //start rule start: sequence+ EOF; sequence: keyword filter?; filter: simpleFilter | logicalFilter | rangeFilter; logicalFilter: andFilter | orFilter | notFilter; simpleFilter: lessFilter | greatFilter
3
Antworten
Bin ich wirklich kämpfen mit der Analyse einer text-Datei. Ich habe eine text-Datei im folgenden format ID Float Float Float Float .... //variable number of floats END ID Float Float Float Float .... END etc Jedoch die
2
Antworten
Ich versuche zu schaffen, eine generalisierte HTML-parser, die gut funktioniert auf Blog-Posts. Ich möchte mein parser auf die spezifischen Eintrag geben Sie die URL, und bekommen Sie wieder saubere text des Beitrags selbst. Mein Ansatz (von python)
3
Antworten
Ich versuche zu finden, die die Abhängigkeit Pfad zwischen zwei Wörtern in Python gegebene Abhängigkeitsstruktur. Für Satz Robotern in der populären Kultur sind da, um zu erinnern uns an die awesomeness von ungebundene menschliche Agentur. Ich verwendet
1
Antworten
Schreiben brauche ich ein Programm in matlab, die Suche nach Schlüsselwörtern in einem text-Datei und liest dann die in dem, was kommt nach diesen Worten, dann weiter suchen.ich habe versucht, fscanf oder textscan, aber ich muss fehlt
1
Antworten
Ich habe eine Reihe von text-Dateien, die ich brauche, um den import in MS Access (in tausend) - kann mit 2007 oder 2010. Die text-Dateien haben die Kategorien identifiziert werden, die in eckigen Klammern und relevante Daten
2
Antworten
Dies ist der text der Datei: #Person PRIM_KEY=personId SEX=gender YEARS=age NAME=fullName #Automobil PRIM_KEY=registrationNumber MAKE=manufacturer TYPE=model Lesen der Datei: Scanner scanner = new Scanner(new FileReader("C:/workspace/column-mapping.txt")); Wenn ich Begegnung #Person in der folgenden Karte definiert: Map<String, String> personMap =
2
Antworten
Ich imaging-dies ist eine einfache Aufgabe, aber ich kann nicht finden, was ich Suche, genau in der vorherigen StackOverflow-Fragen hier geht... Ich haben Sie große text-Dateien in ein proprietry format, das Aussehen comething wie diese: :Entry -
1
Antworten
Habe ich zu Parsen und zu validieren, HIPAA 834 EDI-Datei. Ich habe herausgefunden, ein Werkzeug "EDI-Validator" für diese. EDI-Validator Tool: http://www.etasoft.com/ev.htm Ich bin nicht in der Lage zu bekommen Probe HIPAA X12 834 EDI-Datei, die bearbeitet werden
4
Antworten
Ich habe eine varchar(max) - Feld mit Name-Wert-Paaren, in jeder Zeile habe ich den Namen Unterstrich Wert. Ich brauche eine Abfrage, so dass es liefert den Namen, Wert-Paare in zwei Spalten (also durch analysieren Sie den text,
4
Antworten
Müssen, Lesen Sie die txt-Datei in https://raw.githubusercontent.com/fonnesbeck/Bios6301/master/datasets/addr.txt konvertieren und Sie in ein data-frame R mit der Spalte Nummer als: Nachname, Vorname, streetno, streetname, city, state und zip... Versucht, sep-Befehl, um Sie zu trennen, aber gescheitert sind... Für
7
Antworten
Ich bin versucht zu brechen, bis ein Absatz in Sätzen. Hier ist mein code bisher: import java.util.*; public class StringSplit { public static void main(String args) throws Exception{ String testString = "The outcome of the negotiations is
6
Antworten
Wenn ich Schreibe, Erlang-Programme, die text-Analyse, den ich Häufig in Situationen, in denen ich lieben würde, zu tun, ein Muster, das Spiel mit einem regulären Ausdruck. Zum Beispiel, ich wünschte, ich könnte so etwas tun, wo ~
2
Antworten
Habe ich eine Liste von Worten, ich bin auf der Suche durch eine "Notes" - Feld innerhalb einer Tabelle, dass wenn ich Anzeige, dass Notes-Feld in meinem Crystal-Reports-Bericht, würde ich gerne irgendwie markieren (ändern Sie schriftart, Farbe)
14
Antworten
Wie würde ich sed benutzen, um die löschen Sie alle Zeilen in einer text-Datei, die einen bestimmten string enthalten? InformationsquelleAutor A Clockwork Orange | 2011-03-23
1
Antworten
Entwickeln wir eine Anforderung base social-media-Website mit LAMPE. Für die, die wir tun wollen Resume/CV-Parsing in PHP. Waren wir in der Lage zu analysieren, E-Mail-id und Telefon, aber nicht wissen, wie zu analysieren die anderen Informationen, wie
2
Antworten
Ich versuche zu schreiben ein einfaches Programm, das Fragen für den Benutzer zur Eingabe einer Zahl zwischen 1 und 10, dann Anzeige der Anzahl. Jetzt habe ich so ein Teil auf Arbeit, wo, wenn die Zahl außerhalb
4
Antworten
Habe ich text, der tags enthält, ausgedrückt in diesem format: [text other text]. Möchte ich split den string mit eckigen Klammern als Trennzeichen, aber: String.split("\\[|\\]"); Diese geben nicht die erwarteten Ergebnisse. Wie kann ich dies tun? Die
1
Antworten
Dies ist mein zweiter post und ich bin immer verwendet, um die Funktion der Dinge hier auf jetzt! dies ist mehr eine Theorie Frage für computer-Wissenschaft, aber, meine Frage ist, was bedeutet das? 'Der Analyse einer text-Datei
2
Antworten
Wie kann ich analysieren diese Zeichenfolge auf einem javascript, var string = "http://www.facebook.com/photo.php?fbid=322916384419110&set=a.265956512115091.68575.100001022542275&type=1"; Ich will einfach nur, um die "265956512115091" auf den string. Ich habe irgendwie analysiert diesen string aber noch nicht genug, um zu bekommen, was
3
Antworten
Ich versuche zu Lesen, eine tab-getrennte text-Datei zeilenweise aus. Die Linien sind getrennt durch die Verwendung von carriage return ("\r\n") und Zeilenvorschub (\"n") darf innerhalb der in tab-getrennte text-Felder. Da ich möchte, Lesen Sie die Datei zeilenweise
2
Antworten
Dies ist eine sehr einfache Sache, so will ich halten es so einfach wie es klingt. Alles was ich will ist, laden eine Reihe von Schlüssel-Wert-paires aus einer Datei, und füllen Sie Sie in eine Karte. Ich
4
Antworten
Hat jemand versucht, extrahieren von text aus einem PDF-Dokument mit einer OCR-Bibliothek und Java? Was findest du zu den zuverlässigsten Bibliothek für text-Extraktion. Die meisten der Ansätze, die ich gesehen habe (tesseract, GOCR) sind C-Bibliotheken erfordern würde,
3
Antworten
Habe ich diesen string: %{Children^10 Health "sanitation management"^5} Und ich wollen, es zu konvertieren, um die tokenisierung diese in ein array von hashes: [{:keywords=>"children", :boost=>10}, {:keywords=>"health", :boost=>nil}, {:keywords=>"sanitation management", :boost=>5}] Ich bin mir dessen bewusst, StringScanner und
2
Antworten
wenn ich Stück text, ich bekomme jede Menge von codes in der Ausgabe wie NN, VBD, IN, DT, NNS, RB. Gibt es eine Liste irgendwo dokumentiert, das sagt mir der Sinn dieser? Ich habe versucht, googeln nltk
3
Antworten
Hier einige Beispiel-code: import java.util.Scanner; class In { public static void main (Stringarg) { Scanner in = new Scanner (System.in) ; System.out.println ("how many are invading?") ; int a = in.nextInt() ; System.out.println (a) ; } }
4
Antworten
Ich habe eine Datei mit pipe getrennte Felder. Will ich drucken eine Teilmenge von Feld 1 und alle Feld 2: cat tmpfile.txt # 10 chars.|variable length num|text ABCDEFGHIJ|99|U|HOMEWORK JIDVESDFXW|8|C|CHORES DDFEXFEWEW|73|B|AFTER-HOURS Ich würde gerne die Ausgabe wie folgt
3
Antworten
Schreibe ich eine kleine DB-test-suite, die liest Konfigurationsdateien mit Abfragen und die erwarteten Ergebnisse, z.B.: query = "SELECT * from cities WHERE name='Unknown';" count = 0 level = 1 name = "Check for cities whose name should
9
Antworten
Habe ich eine .txt-Datei mit den folgenden details: ID^NAME^DESCRIPTION^IMAGES 123^test^Some text goes here^image_1.jpg,image_2.jpg 133^hello^some other test^image_3456.jpg,image_89.jpg Was ich tun möchte, ist, analysieren diese Anzeige erhalten Sie die Werte in einem besser lesbaren format, evtl. in ein array,
11
Antworten
Bin ich mit awk durchführen, zählen die Summe einer Spalte in der csv-Datei. Das Daten-format ist so etwas wie: id, name, value 1, foo, 17 2, bar, 76 3, "I am the, question", 99 Ich war mit
9
Antworten
Was wäre die beste Art und Weise, in Python zu analysieren Brocken von text in passenden Klammern? "{ { a } { b } { { { c } } } }" sollten zunächst zurück: [ "{
14
Antworten
Wie würde ich sed benutzen, um die löschen Sie alle Zeilen in einer text-Datei, die einen bestimmten string enthalten? InformationsquelleAutor der Frage A Clockwork Orange | 2011-03-23
20
Antworten
Habe ich eine einzelne Zeichenfolge, die enthält den Kommandozeilen-Parameter übergeben werden, um eine andere ausführbare Datei und ich brauche, um zu extrahieren, den string enthalten die einzelnen Parameter in der gleichen Weise, dass C# wäre, wenn die
5
Antworten
Gibt es einen besseren Weg, um einen string wie "(123) 455-2344" und "1234552344" aus, als dies zu tun: var matches = Regex.Matches(input, @"[0-9]+", RegexOptions.Compiled); return String.Join(string.Empty, matches.Cast<Match>() .Select(x => x.Value).ToArray()); Vielleicht ein regex-pattern, das kann es in
1
Antworten
Ich bin neu text mining. Ich bin mit einem open-source-jar (Mate-Parser), die gibt mir die Ausgabe in eine CoNLL 2009 format nach dependency parsing. Ich will das dependency parsing-Ergebnisse für die Extraktion von Informationen. Aber ich bin
13
Antworten
Ich muss in der Lage sein, zu analysieren beide CSV-und TSV-Dateien. Ich kann nicht Sie verlassen sich auf den Benutzer, den Unterschied zu kennen, so möchte ich vermeiden, den Benutzer zu Fragen, um den Typ auszuwählen. Gibt
30
Antworten
Herausforderung Hier ist die Herausforderung (meine eigene Erfindung, aber ich wäre nicht überrascht, wenn es zuvor erschien an anderer Stelle im web). Schreiben Sie eine Funktion, die eine einzelne argument, das ist eine string-Darstellung eines einfachen mathematischer
6
Antworten
Wie kann man die erste Spalte jeder Zeile in ein Eingabe-CSV-Datei und Ausgabe in eine neue Datei? Ich bin am überlegen mit awk aber nicht sicher, wie. Kommentar zu dem Problem - Öffnen können der ersten Spalte
4
Antworten
Was macht der Analyse einer text-Datei im 'r' - Modus bequemer als parsing - 'rb' - Modus? Vor allem, wenn die text-Datei in der Frage enthalten nicht-ASCII-Zeichen. Kommentar zu dem Problem Lesen Sie eine Textdatei oder eine