Tag: extraction

Extrahieren von Daten ist die Handlung oder Prozess zum abrufen der Daten aus (in der Regel unstrukturierte oder wenig strukturierte) Daten-Quellen für die weitere Datenverarbeitung oder Datenspeicherung (data migration).

Was Ist Die Beste Python-Zip-Modul Zum Umgang Mit Großen Dateien?

Anzahl der Antworten 2 Antworten
EDIT: Speziell Kompression und Extraktion Geschwindigkeiten. Irgendwelche Vorschläge? Dank haben Sie verglichen die Leistung von zipfile, um die Verwendung von zip - /unzip direkt in der shell? InformationsquelleAutor Duck | 2009-11-18

Extrahiert Dateien in demselben Ordner als Archiv mit rekursive Suche in allen Verzeichnissen

Anzahl der Antworten 4 Antworten
Arbeite ich an einer automatisierungstechnischen Aufgabe in PowerShell, extrahiert den Inhalt von mehreren .tar-Archive zu Ihren jeweiligen Unterordner durch die Verwendung von Rekursion und die 7z.exe utility. Im laufen in ein Problem, wo die Ausgabe-dumps in meinem

Extrahieren Sie Bilder und Worte, die mit den Koordinaten und Größen von PDF

Anzahl der Antworten 3 Antworten
Ich hab viel gelesen über PDF-Extraktionen und Bibliotheken (wie iText), aber ich habe nicht gefunden, eine Lösung zum extrahieren von Bildern und text (mit Koordinaten) aus einer PDF-Datei. Ist die Aufgabe, scan-PDF-Katalog der Produkte extrahieren und jedes

Wie extrahieren Sie die vollständige url (mit HtmlAgilityPack - C#

Anzahl der Antworten 2 Antworten
Gut mit dem Weg unten es ist das extrahieren nur die Referrer-url wie diese die Extraktion code : foreach (HtmlNode link in hdDoc.DocumentNode.SelectNodes("//a[@href]")) { lsLinks.Add(link.Attributes["href"].Value.ToString()); } Den url code <a href="Login.aspx">Login</a> Den extrahierten url Login.aspx Aber ich

Wie zu analysieren/extrahieren von Daten aus einer mediawiki-Markup-Artikel über python

Anzahl der Antworten 4 Antworten
Quelle Mediawiki-markup Momentan bin ich mit einer Vielzahl von regexes zu "Parsen" werden die Daten in die mediawiki mark-up in Listen/dictionaries, so dass Elemente innerhalb der Artikel können verwendet werden. Dies ist kaum die beste Methode, da

VB.Net Reguläre Ausdrücke - Extraktion Wildcard-Wert

Anzahl der Antworten 2 Antworten
Muss ich helfen, extrahieren Sie den Wert einer wildcard aus einem Regulären Ausdrücken übereinstimmen. Zum Beispiel: Regex: "ich mag *" Eingang: "ich mag Schokolade" Ich würde gerne in der Lage, zu extrahieren, den string "Schokolade" aus der

Wie kann ich extrahieren Sie die Werte nach dem = in meinem string mit Perl?

Anzahl der Antworten 11 Antworten
Ich habe einen string wie diesen field1=1 field2=2 field3=abc Ich möchte die Ausgabe dieses als 2,1,abc Irgendwelche Ideen, wie kann ich dies angehen? Ich kann schreiben Sie ein kleines C-oder Java-Programm, dies zu tun, versuchen, ich versuche,

EXE-Extraktion / decompiler

Anzahl der Antworten 2 Antworten
Habe ich versucht, ein paar EXE extractor, aber Sie arbeiten nicht auf eine Menge von Dateien. Ich bin auf der Suche nach etwas besserem. Wenn Sie dachten, "EXE-extractor" ist ein technischer Begriff, der Irrt. Was haben Sie

Wie kann ich extrahieren einer Ressource in eine Datei zur Laufzeit?

Anzahl der Antworten 4 Antworten
Will ich verteilen nur ein einziges .exe, aber bei der Spielzeit würde ich mag es zu extrahieren einige eingebettete Bild-Ressourcen an die Benutzer Festplatte. Kann ich, und wenn ja, wie? InformationsquelleAutor Mawg | 2010-09-10

Beispiel für die Verwendung PyLZMA

Anzahl der Antworten 2 Antworten
Möchte ich PyLZMA zum extrahieren einer Datei aus einem Archiv (z.B. test.7z) und extrahieren Sie es in das gleiche Verzeichnis. Ich bin ein Neuling auf Python und habe keine Ahnung wie ich anfangen soll. Ich habe einige

Erstellen von Daten-dump in Excel abrufen von Daten von der Website

Anzahl der Antworten 1 Antworten
Ich bin auf der Suche nach pull-college-football-team-Statistiken aus www.cfbstats.com. Die teams werden aufgelistet auf der linken Seite und klicken in Ihnen werden Sie ergreifen, um den team-Saison-Statistik. Ich möchte zu ziehen, Teil dieser Statistiken in Excel, damit

Wie extrahieren Sie den Quellcode aus einer *.jar-Datei auf einem Mac?

Anzahl der Antworten 3 Antworten
Ich bin sehr verwirrt. Ich habe einen *.jar-Datei als ein bisschen software. Also, ich möchte um den source code zu schauen, Ich habe den Befehl jar xf filename.jar welche zurückgegeben zwei weitere *.jar Dateien und eine *.class

Wie zum extrahieren von HTML-tags, um nur bestimmte Informationen?

Anzahl der Antworten 5 Antworten
Brauch ich zu extrahieren der Webseite Titel aus zwischen den <title> </title> tags. Müssen auch alle anzeigen der text befindet sich zwischen den <body...> und </body> tags, aber nichts außerhalb des Körpers. Ich will keine Spitzen Klammern

Wie soll ich extrahieren Sie komprimierte Ordner in java?

Anzahl der Antworten 3 Antworten
Ich bin mit dem folgenden code zu extrahieren zip-Datei in Java. import java.io.*; import java.util.zip.*; class testZipFiles { public static void main(String args) { try { String filename = "C:\\zip\\includes.zip"; testZipFiles list = new testZipFiles( ); list.getZipFiles(filename);

Auszug LSB bit aus einem Byte, das in python

Anzahl der Antworten 2 Antworten
Habe ich ein byte in der Variable 'DATA'. Ich möchte zum extrahieren der LSB bit aus und drucken Sie es. Ich bin ganz neu bei python, ich fand viele Artikel mit komplexen bitweise addition Logik und alle,

Wie zum extrahieren von Daten aus HTML-Seiten?

Anzahl der Antworten 3 Antworten
Brauche ich zum extrahieren von text aus einem html-basierten website. Ich habe über 3000 URLs und müssen, extrahieren Sie eine einzelne Textzeile aus Ihrem html. Die Daten, die ich brauche sieht so aus: <html xmlns:og="http://opengraphprotocol.org/schema/"> <head> <title>Pink

MATLAB: extrahieren von Gruppen von Spalten in einer submatrix?

Anzahl der Antworten 3 Antworten
Ich habe einen Datensatz, in dem ich zu extrahierenden Spalten 1-3, 7-9, 13-15, alle den Weg an das Ende der matrix Als Beispiel, ich habe die standard-magic-Funktion um eine matrix zu erstellen A=magic(10) A = 92 99

Extrahieren von text aus einem XPS-Dokument

Anzahl der Antworten 4 Antworten
muss ich extrahieren Sie den text von einer bestimmten Seite aus einem XPS-Dokument. Der extrahierte text geschrieben werden soll in einen string. Ich brauche diese, um Lesen Sie den extrahierten text mit Microsoft SpeechLib. Bitte nur Beispiele

Python regex - extrahieren von Verzeichnissen vom Pfad

Anzahl der Antworten 4 Antworten
Ich habe eine Frage zu regex/Python. Sorry, wenn dieses Thema diskutiert wurde, Millionen mal - in der Regel finde ich die Antworten auf so/google usw. aber ich bin stecken in Millionen von Antworten mit diese.. (um ehrlich

wie können wir extrahieren von text aus pdf mit itextsharp mit Leerzeichen?

Anzahl der Antworten 3 Antworten
Bin ich mit dem folgenden Verfahren zu extrahieren pdf-text Zeile für Zeile. Aber das problem, dass es keine lese-Leerzeichen zwischen den Wörtern und zahlen. was könnte die Lösung für dieses ?? Ich will einfach nur das erstellen

Extrahieren von Video-frames in Android

Anzahl der Antworten 3 Antworten
Wollte ich wissen, ob es möglich ist, zu extrahieren frames aus einem Laufenden Video in Android? Ich benötige zum extrahieren von frames, die in regelmäßigen Abständen und senden Sie Sie für die weitere Verarbeitung. Wäre jemand in

Ist es möglich, zu dekompilieren ein .dll/.pyd-Datei zu extrahieren, Python-Source-Code?

Anzahl der Antworten 2 Antworten
Gibt es irgendwelche Möglichkeiten, um eine dll zu dekompilieren und/oder ein .pyd-Datei um extrahieren von Quellcode, geschrieben in Python? Vielen Dank im Voraus Ja. Und es ist gefragt worden, bevor ich abstimmen, um diese zu schließen und

Wie zum extrahieren von Daten aus einer PDF-Datei?

Anzahl der Antworten 6 Antworten
Mein Unternehmen erhält Daten von einer externen Firma über Excel. Wir exportieren diese in SQL Server zum ausführen von berichten auf die Daten. Sie wechseln jetzt in das PDF-format, gibt es eine Möglichkeit, zuverlässig port die Daten

mit Hilfe der Karte zu extrahieren, hash-set von (Schlüssel, Wert) spezifizierten Wert

Anzahl der Antworten 4 Antworten
Bin ich auf der Suche nach einem Weg, führen Sie die folgende Aktion mit der perl-Funktion map: gegeben einen Hashwert, ich will zum extrahieren von Paaren (Schlüssel, Wert) - bei dem der Wert gleich oder entspricht einem

Extrahieren Sie alle bounding-Boxen, die mit OpenCV Python

Anzahl der Antworten 1 Antworten
Habe ich ein Bild, das mehr enthält, als ein zusammenhängendes Feld. Brauch ich zu extrahieren alles, was bounding Boxen in Ihnen. So weit, von dieser Seite habe ich diese Antwort: y = img[by:by+bh, bx:bx+bw] cv2.imwrite(string + '.png',

erste string zwischen 2 Zeichen in python

Anzahl der Antworten 4 Antworten
Ich brauche, um bestimmte Wörter aus einer Zeichenkette in einem neuen format. Zum Beispiel rufe ich die Funktion mit der Eingabe: text2function('$sin (x)$ is an function of x') und ich brauche, um Sie in eine StringFunction: StringFunction(function,

Wie zum extrahieren von links aus einer Webseite mit lxml -, XPath-und Python?

Anzahl der Antworten 2 Antworten
Habe ich diese xpath-Abfrage: /html/body//tbody/tr[*]/td[*]/a[@title]/@href Es extrahiert alle links mit title-Attribut und gibt die href im FireFox Xpath checker add-on. Aber ich kann nicht scheinen, um es mit lxml. from lxml import etree parsedPage = etree.HTML(page) #

OpenCV: Wie man inlier Punkte mit findHomography()/findFundamental() und RANSAC

Anzahl der Antworten 2 Antworten
OpenCV bietet keine RANSAC-Funktion per se oder zumindest in einer solchen form, dass Sie können einfach rufen und mit ihm getan werden (z.B. cv::ransac(...)). Alle Funktionen/Methoden, die in der Lage sind zu verwenden, RANSAC, eine Flagge, die

Java: Apache POI: Kann ich get clean text aus MS Word (.doc) - Dateien?

Anzahl der Antworten 3 Antworten
Den Saiten, die ich (programmatisch) von MS-Word-Dateien beim Apache-POI sind nicht der gleiche text, den ich mir ansehen kann, wenn ich die Dateien öffnen mit MS Word. Wenn mit dem folgenden code: File someFile = new File("some\\path\\MSWFile.doc");

Wie zum extrahieren von Daten aus einer PDF-Datei während der Verfolgung seiner Struktur?

Anzahl der Antworten 5 Antworten
Mein Ziel ist, extrahieren Sie den text und Bilder aus einer PDF-Datei, die beim analysieren seine Struktur. Den Rahmen für die Analyse der Struktur ist nicht erschöpfend; ich muss nur in der Lage sein, zu identifizieren, überschriften

Funktion Namen-Extraktion aus statischen Bibliothek

Anzahl der Antworten 2 Antworten
Habe ich eine statische Bibliothek static_library.ein How to Listen-Funktionen und-Methoden erkannte. oder zumindest, wie Sie Aussehen gibt es konkrete Funktion 'FUNKTIONSNAME' realisiert? InformationsquelleAutor Max | 2010-04-26

Speichern Sie Teil der matching-Muster auf variable

Anzahl der Antworten 4 Antworten
Möchte ich extrahieren, die substring-matching-Muster und speichern es in einer Datei. Ein Beispiel-string: Apr 12 19:24:17 PC_NMG kernel: sd 11:0:0:0: [sdf] Attached SCSI removable disk Möchte ich zum extrahieren der Teil zwischen den Klammern, in diesem Fall

PDF-Extraktion Tabelle

Anzahl der Antworten 7 Antworten
Ich habe die (gleichen) Daten gespeichert als GIF-Bild-Datei und als PDF-Datei und ich möchte das Parsen in HTML-oder XML. Die Daten ist eigentlich das Menü für meine Uni-cafeteria. Das bedeutet, dass es eine neue version der Datei,

Wie man audio-Daten von einer MP3?

Anzahl der Antworten 3 Antworten
Arbeite ich an einer Anwendung, die zur Bearbeitung von audio-Dateien. Bei der Verwendung von mp3-Dateien bin ich mir nicht sicher, wie Sie Sie zu behandeln, Daten (die Daten, die ich bin daran interessiert, sind die audio-bytes, die

Stroke Width Transform (SWT), Implementierung (Java, C#...)

Anzahl der Antworten 2 Antworten
Habe ich vor kurzem entdeckt die stroke width transform, dokumentiert, wie in der folgenden Publikation: Die Erkennung von Text in Natürlichen Szenen mit der Stroke Width Transform. Boris Epshtein, Yonathan Wexler, und Eyal Ofek. IEEE International Conference

Extrahieren von Informationen aus PDFs von Forschungsarbeiten

Anzahl der Antworten 13 Antworten
Brauche ich einen Mechanismus für die Extraktion von bibliographischen Metadaten aus PDF-Dokumenten, um Menschen zu retten Eingabe von hand oder durch Ausschneiden und einfügen. Zumindest der Titel und die Kurzbeschreibung. Die Liste der Autoren und deren Zugehörigkeiten

Wie extrahieren Sie eine Spalte aus einem mehrdimensionalen Array?

Anzahl der Antworten 17 Antworten
Weiß jemand, wie extrahieren von Spalten aus mehrdimensionalen Arrays in Python? InformationsquelleAutor der Frage | 2009-05-24

Reguläre Ausdrücke C # - Ist es möglich, Übereinstimmungen zu extrahieren, während sie übereinstimmen?

Anzahl der Antworten 4 Antworten
Sagen, ich habe einen string, den ich brauche, um zu überprüfen Sie das richtige format, z.B. RR1234566-001 (2 Buchstaben, 7 Ziffern, Bindestrich, 1 oder mehr Ziffern). Ich verwende so etwas wie: Regex regex = new Regex(patternString); if

Extrahiere die Zeichenfolge zwischen den Zitaten

Anzahl der Antworten 3 Antworten
Möchte ich extrahieren von Informationen vom Benutzer eingegebenen text. Stell ich die folgende Eingabe: SetVariables "a" "b" "c" Wie kann ich das extrahieren von Informationen zwischen dem ersten Satz von Zitaten? Dann die zweite? Dann der Dritte?

Wie extrahiere ich Text aus einer PDF?

Anzahl der Antworten 15 Antworten
Kann jemand empfehlen, eine Bibliothek/API zum extrahieren der Texte und Bilder aus einer PDF-Datei? Wir müssen in der Lage sein zu Holen auf den text, die enthaltenen pre-bekannten Regionen des Dokuments, so dass die API müssen, um

Welchen Algorithmus verwendet die Lesbarkeit zum Extrahieren von Text aus URLs?

Anzahl der Antworten 4 Antworten
Für eine Weile, ich habe versucht, einen Weg zu finden, intelligent zu extrahieren, die "relevanten" text von einer URL durch den Wegfall der text im Zusammenhang zu ads und all den anderen Krempel.Nach mehreren Monaten der recherche

Wie extrahiere ich eine Datei von einer rpm in das aktuelle Verzeichnis?

Anzahl der Antworten 1 Antworten
Vor kurzem fand ich heraus, über die Existenz von cpio und wie es verwendet werden kann, unter vielen anderen Sachen, zu extrahieren einzelner Dateien aus einem rpm in Verbindung mit der rpm2cpio-tool, wie diesem: rpm2cpio mypackage.rpm |