Extrahieren Sie text pro Seite mit Python pdfMiner?

Habe ich experimentierte mit beiden pyPdf und pdfMiner zum extrahieren von text aus pdf-Dateien. Ich habe einige unfreundliche PDF-Dateien, die nur pdfMiner ist in der Lage zu extrahieren erfolgreich. Ich bin mit dem code hier zum extrahieren von text für die gesamte Datei. Allerdings würde ich wirklich gerne zum extrahieren von text auf einer basis pro Seite, wie die getPage(i).extractText() Funktionalität in pyPdf. Weiß jemand, wie extrahieren von text pro Seite pdfMiner?

InformationsquelleAutor | 2012-09-26
Schreibe einen Kommentar