Tag: pdfminer
Ein python-basiertes tool für das extrahieren von Informationen aus PDF-Dokumenten.
2
Antworten
Dies ist der code, den ich irgendwo gefunden hier. Ich habe keine Ahnung, wie es zu benutzen. Kann jemand mir erklären diese und mir helfen, konvertieren Sie eine Beispiel-pdf? from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter from pdfminer.converter import
3
Antworten
War ich nicht installieren -pdfminer- mit der source-distribution, so dass ich versuchte zu verwenden binstar zu tun. Da bin ich mit der Ananconda-distribution von Python, ich Typ: conda install -c https://conda.binstar.org/jacksongs pdfminer aber bekomme die folgende Fehlermeldung:
1
Antworten
Ich zuerst konvertieren von pdf in text (ich Drucke Sie aus und alles ist in Ordnung) und dann bekomme ich ein UnicodeDecodeError wenn ich versuche zu laufen word_tokenize() from NLTK. Bekomme ich diesen error obwohl ich versuche,
1
Antworten
Immer wenn ich pdf2txt.py auf mein Kommando Zeile der Quell-Datei geöffnet und den Befehl nicht ausführen. Ich habe einfach nur die Pakete installiert und nicht in der Lage, es zu laufen. Ich werde zum Beispiel geben Sie
4
Antworten
In Python bin ich mit pdfminer Lesen Sie den text aus einer pdf-Datei mit dem code unterhalb dieser Meldung. Bekomme ich jetzt eine Fehlermeldung, die besagt: File "/usr/local/lib/python2.7/dist-packages/pdfminer/pdfpage.py", line 124, in get_pages raise PDFTextExtractionNotAllowed('Text extraction is not
1
Antworten
PDFMiner in der Dokumentation sagt: PDFMiner erlaubt zu erhalten, die genaue Position von text auf einer Seite Allerdings habe ich nicht in der Lage gewesen zu finden, wie dies zu tun. PDFMiner die 'Dokumentation' ist eher spärlich,
2
Antworten
Ich versuche zu installieren pdfMiner arbeiten mit CollectiveAccess. Meine host - (pair.com) hat mir die folgenden Informationen helfen Ihnen bei dieser Suche: Beim kompilieren, wird es wahrscheinlich notwendig sein, zu unterweisen installation zur Nutzung Ihres Kontos Platz
1
Antworten
Ich möchte in der Lage sein, um PDF-Dateien in CSV-Dateien und haben einige nützliche Skripte, aber, wird neu in Python, ich habe eine Frage: Wo geben Sie den Dateipfad für die PDF-Datei und die CSV, die Sie
4
Antworten
Ich habe ein paar tutorials um, aber ich bin nicht in der Lage, diese code-block ausgeführt, ich habe die notwendige Schalter aus StringIO zu BytesIO (glaube ich?) Ich bin nicht sicher, warum 'Banane' ist Druck nichts, ich
1
Antworten
Möchte ich extrahieren Sie alle Textfelder und text-Koordinaten aus einer PDF-Datei. Viele andere StackOverflow-posts-Adresse verschiedene Lösungen, um zu versuchen, zu extrahieren alle Texte in geordneter Art und Weise, aber es dauerte eine ganze Weile, um herauszufinden, wie
2
Antworten
Python-Version 2.7 Ich bin auf der Suche nach Dokumentation oder Beispiele auf, wie zum extrahieren von text aus einer PDF-Datei mit PDFMiner mit Python. Sieht es aus wie PDFMiner aktualisiert Ihre API und alle die einschlägigen Beispiele,
14
Antworten
Ich versuche, text-Daten aus einem pdf-Dokument mit pdfminer. Ich bin in der Lage, zum extrahieren dieser Daten ein .txt-Datei erfolgreich mit dem pdfminer Kommandozeilen-tool pdf2txt.py. Momentan mache ich dies und dann mit einem python-script zu bereinigen .txt-Datei.