C # Extrahieren Sie Text aus PDF mit PdfSharp
Gibt es eine Möglichkeit zum extrahieren von plain-text aus einer PDF-Datei mit PdfSharp?
Ich will nicht von iTextSharp, weil seine Lizenz.
Dank für Eure Antworten.
EDIT: ich weiß, dass es möglich ist. Aber wie mache ich das?
InformationsquelleAutor der Frage der_chirurg | 2012-04-13
Du musst angemeldet sein, um einen Kommentar abzugeben.
Nahm Sergios Antwort und machte einige extension-Methoden. Ich habe auch die Ansammlung von strings in einen iterator.
InformationsquelleAutor der Antwort Ronnie Overby
Habe ich umgesetzt es irgendwie ähnlich, wie David es Tat.
Hier ist mein code:
InformationsquelleAutor der Antwort Sergio
PDFSharp bietet alle Werkzeuge zum extrahieren von text aus einer PDF-Datei. Verwenden Sie die
ContentReader
Klasse für den Zugriff auf die Befehle in jede Seite und extrahieren des strings aus dem TJ/Tj Betreiber.Ich habe hochgeladen eine einfache Implementierung zu github.
InformationsquelleAutor der Antwort David Schmitt