tesserakt (.NET) + durchsuchbare PDF-Datei. Wie bewerben Sie sich?
Habe ich das Bedürfnis, ein system zu entwickeln, das verwandelt ein Bild in eine durchsuchbare PDF-Datei.
Wie ist eine Schule arbeite, brauche ich etwas mit open source
Nach viel Forschung fand ich tessnet2 (tesseract) und ich kann Sie löschen einen text, wird das Bild im tiff-format.
Aber wie konvertieren diese Informationen in einer PDF-Datei?
Achtung : ich brauche, um die Datei-Struktur.
Brauche ich eine Richtung zu gehen mit meiner Forschung. Mir bitte jemand helfen.
danke
- Ich denke, in der Lage sein, dies zu tun müssten Sie ein OCR-Bibliothek, die würde der job für Sie tun. Es ist ein wenig zu kompliziert, um in der Lage zu diskutieren, QnA-Website.
- Shakti, Was empfehlen Sie mir?
- Ich schlage vor, mit: link genau wie ich mich für diese Art von Arbeit. Code kann gelernt werden, dass neue Kontur aus beiden scans als Schriftarten. Ich verwende es selbst für Kennzeichen-Erkennung.
- user2754599 - So verstehe ich es würde mir helfen zu erkennen, der text, toll! Aber wie die Konvertierung in durchsuchbares pdf?
Du musst angemeldet sein, um einen Kommentar abzugeben.
Gibt es ein paar .NETTO-hOCR-zu-PDF-Bibliothek, die Sie möchten möglicherweise check-out bei Tesseract 3rdParty Seite.