Tag: text-parsing

Text-Analyse ist eine Variante der Analyse, die sich auf die Aktion zu brechen, ein Strom von text in unterschiedliche Komponenten und die Erfassung der Beziehung zwischen diesen Komponenten.

Warum tritt 'keine brauchbare alternative am Eingang'?

Anzahl der Antworten 2 Antworten
Schrieb ich die folgenden kombinierten Grammatik: grammar KeywordGrammar; options{ TokenLabelType = MyToken; } //start rule start: sequence+ EOF; sequence: keyword filter?; filter: simpleFilter | logicalFilter | rangeFilter; logicalFilter: andFilter | orFilter | notFilter; simpleFilter: lessFilter | greatFilter

Java-Buffered Reader Text-Datei Parsen

Anzahl der Antworten 3 Antworten
Bin ich wirklich kämpfen mit der Analyse einer text-Datei. Ich habe eine text-Datei im folgenden format ID Float Float Float Float .... //variable number of floats END ID Float Float Float Float .... END etc Jedoch die

Erstellen Sie Tolle Parser - Relevante Text Aus HTML/Blogs

Anzahl der Antworten 2 Antworten
Ich versuche zu schaffen, eine generalisierte HTML-parser, die gut funktioniert auf Blog-Posts. Ich möchte mein parser auf die spezifischen Eintrag geben Sie die URL, und bekommen Sie wieder saubere text des Beitrags selbst. Mein Ansatz (von python)

Wie finden Sie den kürzesten Abhängigkeit Pfad zwischen zwei Wörtern in Python?

Anzahl der Antworten 3 Antworten
Ich versuche zu finden, die die Abhängigkeit Pfad zwischen zwei Wörtern in Python gegebene Abhängigkeitsstruktur. Für Satz Robotern in der populären Kultur sind da, um zu erinnern uns an die awesomeness von ungebundene menschliche Agentur. Ich verwendet

Wie kann ich suchen eine text-Datei, die für bestimmte Wörter, die mit matlab?

Anzahl der Antworten 1 Antworten
Schreiben brauche ich ein Programm in matlab, die Suche nach Schlüsselwörtern in einem text-Datei und liest dann die in dem, was kommt nach diesen Worten, dann weiter suchen.ich habe versucht, fscanf oder textscan, aber ich muss fehlt

Parse und import unstrukturierter text-Dateien in Microsoft Access (Datei hat Potenzial Trennzeichen)

Anzahl der Antworten 1 Antworten
Ich habe eine Reihe von text-Dateien, die ich brauche, um den import in MS Access (in tausend) - kann mit 2007 oder 2010. Die text-Dateien haben die Kategorien identifiziert werden, die in eckigen Klammern und relevante Daten

Lesen Sie den text-Datei und speichert die Schlüssel-Wert-Paare in verschiedenen Karten

Anzahl der Antworten 2 Antworten
Dies ist der text der Datei: #Person PRIM_KEY=personId SEX=gender YEARS=age NAME=fullName #Automobil PRIM_KEY=registrationNumber MAKE=manufacturer TYPE=model Lesen der Datei: Scanner scanner = new Scanner(new FileReader("C:/workspace/column-mapping.txt")); Wenn ich Begegnung #Person in der folgenden Karte definiert: Map<String, String> personMap =

Aufteilen von großen text-Datei, die durch ein Trennzeichen in Python

Anzahl der Antworten 2 Antworten
Ich imaging-dies ist eine einfache Aufgabe, aber ich kann nicht finden, was ich Suche, genau in der vorherigen StackOverflow-Fragen hier geht... Ich haben Sie große text-Dateien in ein proprietry format, das Aussehen comething wie diese: :Entry -

Wie verarbeiten HIPAA 834 EDI-Datei?

Anzahl der Antworten 1 Antworten
Habe ich zu Parsen und zu validieren, HIPAA 834 EDI-Datei. Ich habe herausgefunden, ein Werkzeug "EDI-Validator" für diese. EDI-Validator Tool: http://www.etasoft.com/ev.htm Ich bin nicht in der Lage zu bekommen Probe HIPAA X12 834 EDI-Datei, die bearbeitet werden

Wie, eine Zeichenfolge zu analysieren und erstellen Sie mehrere Spalten aus oder?

Anzahl der Antworten 4 Antworten
Ich habe eine varchar(max) - Feld mit Name-Wert-Paaren, in jeder Zeile habe ich den Namen Unterstrich Wert. Ich brauche eine Abfrage, so dass es liefert den Namen, Wert-Paare in zwei Spalten (also durch analysieren Sie den text,

wie zum Lesen von text-Dateien, und erstellen Sie einen Daten-frame in R

Anzahl der Antworten 4 Antworten
Müssen, Lesen Sie die txt-Datei in https://raw.githubusercontent.com/fonnesbeck/Bios6301/master/datasets/addr.txt konvertieren und Sie in ein data-frame R mit der Spalte Nummer als: Nachname, Vorname, streetno, streetname, city, state und zip... Versucht, sep-Befehl, um Sie zu trennen, aber gescheitert sind... Für

Zum analysieren von text in Sätze,

Anzahl der Antworten 7 Antworten
Ich bin versucht zu brechen, bis ein Absatz in Sätzen. Hier ist mein code bisher: import java.util.*; public class StringSplit { public static void main(String args) throws Exception{ String testString = "The outcome of the negotiations is

Wie zu tun, Erlang pattern matching mit regulären Ausdrücken?

Anzahl der Antworten 6 Antworten
Wenn ich Schreibe, Erlang-Programme, die text-Analyse, den ich Häufig in Situationen, in denen ich lieben würde, zu tun, ein Muster, das Spiel mit einem regulären Ausdruck. Zum Beispiel, ich wünschte, ich könnte so etwas tun, wo ~

Formatierung bestimmte Worte in einem text-string in Crystal Reports

Anzahl der Antworten 2 Antworten
Habe ich eine Liste von Worten, ich bin auf der Suche durch eine "Notes" - Feld innerhalb einer Tabelle, dass wenn ich Anzeige, dass Notes-Feld in meinem Crystal-Reports-Bericht, würde ich gerne irgendwie markieren (ändern Sie schriftart, Farbe)

Löschen von Zeilen in einer text-Datei, die einen bestimmten string enthalten

Anzahl der Antworten 14 Antworten
Wie würde ich sed benutzen, um die löschen Sie alle Zeilen in einer text-Datei, die einen bestimmten string enthalten? InformationsquelleAutor A Clockwork Orange | 2011-03-23

Resume/CV-Parsing in PHP

Anzahl der Antworten 1 Antworten
Entwickeln wir eine Anforderung base social-media-Website mit LAMPE. Für die, die wir tun wollen Resume/CV-Parsing in PHP. Waren wir in der Lage zu analysieren, E-Mail-id und Telefon, aber nicht wissen, wie zu analysieren die anderen Informationen, wie

Konvertieren JOptionPane Eingabe von integer

Anzahl der Antworten 2 Antworten
Ich versuche zu schreiben ein einfaches Programm, das Fragen für den Benutzer zur Eingabe einer Zahl zwischen 1 und 10, dann Anzeige der Anzahl. Jetzt habe ich so ein Teil auf Arbeit, wo, wenn die Zahl außerhalb

Wie zum extrahieren von text zwischen den eckigen Klammern mit der String.split

Anzahl der Antworten 4 Antworten
Habe ich text, der tags enthält, ausgedrückt in diesem format: [text other text]. Möchte ich split den string mit eckigen Klammern als Trennzeichen, aber: String.split("\\[|\\]"); Diese geben nicht die erwarteten Ergebnisse. Wie kann ich dies tun? Die

was bedeutet das 'Parsen Sie einen text-Datei oder Daten' und nicht mit serializables

Anzahl der Antworten 1 Antworten
Dies ist mein zweiter post und ich bin immer verwendet, um die Funktion der Dinge hier auf jetzt! dies ist mehr eine Theorie Frage für computer-Wissenschaft, aber, meine Frage ist, was bedeutet das? 'Der Analyse einer text-Datei

Parse string in javascript

Anzahl der Antworten 2 Antworten
Wie kann ich analysieren diese Zeichenfolge auf einem javascript, var string = "http://www.facebook.com/photo.php?fbid=322916384419110&set=a.265956512115091.68575.100001022542275&type=1"; Ich will einfach nur, um die "265956512115091" auf den string. Ich habe irgendwie analysiert diesen string aber noch nicht genug, um zu bekommen, was

Java: Wie liest die Datei Zeile für Zeile durch ignorieren "\n"

Anzahl der Antworten 3 Antworten
Ich versuche zu Lesen, eine tab-getrennte text-Datei zeilenweise aus. Die Linien sind getrennt durch die Verwendung von carriage return ("\r\n") und Zeilenvorschub (\"n") darf innerhalb der in tab-getrennte text-Felder. Da ich möchte, Lesen Sie die Datei zeilenweise

Last, std::map aus der text-Datei

Anzahl der Antworten 2 Antworten
Dies ist eine sehr einfache Sache, so will ich halten es so einfach wie es klingt. Alles was ich will ist, laden eine Reihe von Schlüssel-Wert-paires aus einer Datei, und füllen Sie Sie in eine Karte. Ich

PDF-Text-Extraktions-Ansatz Mittels OCR

Anzahl der Antworten 4 Antworten
Hat jemand versucht, extrahieren von text aus einem PDF-Dokument mit einer OCR-Bibliothek und Java? Was findest du zu den zuverlässigsten Bibliothek für text-Extraktion. Die meisten der Ansätze, die ich gesehen habe (tesseract, GOCR) sind C-Bibliotheken erfordern würde,

Wie kann ich die tokenisierung dieser string in Ruby?

Anzahl der Antworten 3 Antworten
Habe ich diesen string: %{Children^10 Health "sanitation management"^5} Und ich wollen, es zu konvertieren, um die tokenisierung diese in ein array von hashes: [{:keywords=>"children", :boost=>10}, {:keywords=>"health", :boost=>nil}, {:keywords=>"sanitation management", :boost=>5}] Ich bin mir dessen bewusst, StringScanner und

Was bedeutet NN VBD IN DT RB NNS bedeutet in NLTK?

Anzahl der Antworten 2 Antworten
wenn ich Stück text, ich bekomme jede Menge von codes in der Ausgabe wie NN, VBD, IN, DT, NNS, RB. Gibt es eine Liste irgendwo dokumentiert, das sagt mir der Sinn dieser? Ich habe versucht, googeln nltk

Wie halte ich einen Scanner zu werfen Ausnahmen, wenn die falschen Typs eingetragen ist?

Anzahl der Antworten 3 Antworten
Hier einige Beispiel-code: import java.util.Scanner; class In { public static void main (Stringarg) { Scanner in = new Scanner (System.in) ; System.out.println ("how many are invading?") ; int a = in.nextInt() ; System.out.println (a) ; } }

Sollte ich die cut oder awk extrahieren Feldern und Zeichenketten?

Anzahl der Antworten 4 Antworten
Ich habe eine Datei mit pipe getrennte Felder. Will ich drucken eine Teilmenge von Feld 1 und alle Feld 2: cat tmpfile.txt # 10 chars.|variable length num|text ABCDEFGHIJ|99|U|HOMEWORK JIDVESDFXW|8|C|CHORES DDFEXFEWEW|73|B|AFTER-HOURS Ich würde gerne die Ausgabe wie folgt

Python: Lesen der Konfiguration-Datei mit mehreren Zeilen pro Schlüssel

Anzahl der Antworten 3 Antworten
Schreibe ich eine kleine DB-test-suite, die liest Konfigurationsdateien mit Abfragen und die erwarteten Ergebnisse, z.B.: query = "SELECT * from cities WHERE name='Unknown';" count = 0 level = 1 name = "Check for cities whose name should

PHP - Parsing einer TXT-Datei

Anzahl der Antworten 9 Antworten
Habe ich eine .txt-Datei mit den folgenden details: ID^NAME^DESCRIPTION^IMAGES 123^test^Some text goes here^image_1.jpg,image_2.jpg 133^hello^some other test^image_3456.jpg,image_89.jpg Was ich tun möchte, ist, analysieren diese Anzeige erhalten Sie die Werte in einem besser lesbaren format, evtl. in ein array,

Kann awk mit CSV-Datei umgehen, die Komma in einem zitierten Feld enthält?

Anzahl der Antworten 11 Antworten
Bin ich mit awk durchführen, zählen die Summe einer Spalte in der csv-Datei. Das Daten-format ist so etwas wie: id, name, value 1, foo, 17 2, bar, 76 3, "I am the, question", 99 Ich war mit

Python Parsing geklammerte Blöcke

Anzahl der Antworten 9 Antworten
Was wäre die beste Art und Weise, in Python zu analysieren Brocken von text in passenden Klammern? "{ { a } { b } { { { c } } } }" sollten zunächst zurück: [ "{

Löschen Sie Zeilen in einer Textdatei, die eine bestimmte Zeichenfolge enthalten

Anzahl der Antworten 14 Antworten
Wie würde ich sed benutzen, um die löschen Sie alle Zeilen in einer text-Datei, die einen bestimmten string enthalten? InformationsquelleAutor der Frage A Clockwork Orange | 2011-03-23

Geteilte Zeichenfolge mit Befehlszeilenparametern in Zeichenfolge [] in C #

Anzahl der Antworten 20 Antworten
Habe ich eine einzelne Zeichenfolge, die enthält den Kommandozeilen-Parameter übergeben werden, um eine andere ausführbare Datei und ich brauche, um zu extrahieren, den string enthalten die einzelnen Parameter in der gleichen Weise, dass C# wäre, wenn die

Der beste Weg, um alle Ziffern aus einer Zeichenfolge zu erhalten

Anzahl der Antworten 5 Antworten
Gibt es einen besseren Weg, um einen string wie "(123) 455-2344" und "1234552344" aus, als dies zu tun: var matches = Regex.Matches(input, @"[0-9]+", RegexOptions.Compiled); return String.Join(string.Empty, matches.Cast<Match>() .Select(x => x.Value).ToArray()); Vielleicht ein regex-pattern, das kann es in

Was ist das CoNLL-Datenformat?

Anzahl der Antworten 1 Antworten
Ich bin neu text mining. Ich bin mit einem open-source-jar (Mate-Parser), die gibt mir die Ausgabe in eine CoNLL 2009 format nach dependency parsing. Ich will das dependency parsing-Ergebnisse für die Extraktion von Informationen. Aber ich bin

Wie soll ich feststellen, welches Trennzeichen in einer Textdatei verwendet wird?

Anzahl der Antworten 13 Antworten
Ich muss in der Lage sein, zu analysieren beide CSV-und TSV-Dateien. Ich kann nicht Sie verlassen sich auf den Benutzer, den Unterschied zu kennen, so möchte ich vermeiden, den Benutzer zu Fragen, um den Typ auszuwählen. Gibt

Eine Reihe einfacher mathematischer Ausdrücke auswerten

Anzahl der Antworten 30 Antworten
Herausforderung Hier ist die Herausforderung (meine eigene Erfindung, aber ich wäre nicht überrascht, wenn es zuvor erschien an anderer Stelle im web). Schreiben Sie eine Funktion, die eine einzelne argument, das ist eine string-Darstellung eines einfachen mathematischer

Wie bekomme ich die erste Spalte jeder Zeile aus einer CSV-Datei?

Anzahl der Antworten 6 Antworten
Wie kann man die erste Spalte jeder Zeile in ein Eingabe-CSV-Datei und Ausgabe in eine neue Datei? Ich bin am überlegen mit awk aber nicht sicher, wie. Kommentar zu dem Problem - Öffnen können der ersten Spalte

Unterschied zwischen dem Parsen einer Textdatei im r- und rb-Modus

Anzahl der Antworten 4 Antworten
Was macht der Analyse einer text-Datei im 'r' - Modus bequemer als parsing - 'rb' - Modus? Vor allem, wenn die text-Datei in der Frage enthalten nicht-ASCII-Zeichen. Kommentar zu dem Problem Lesen Sie eine Textdatei oder eine