tesserakt (.NET) + durchsuchbare PDF-Datei. Wie bewerben Sie sich?

Habe ich das Bedürfnis, ein system zu entwickeln, das verwandelt ein Bild in eine durchsuchbare PDF-Datei.
Wie ist eine Schule arbeite, brauche ich etwas mit open source
Nach viel Forschung fand ich tessnet2 (tesseract) und ich kann Sie löschen einen text, wird das Bild im tiff-format.
Aber wie konvertieren diese Informationen in einer PDF-Datei?
Achtung : ich brauche, um die Datei-Struktur.

Brauche ich eine Richtung zu gehen mit meiner Forschung. Mir bitte jemand helfen.

danke

Ich denke, in der Lage sein, dies zu tun müssten Sie ein OCR-Bibliothek, die würde der job für Sie tun. Es ist ein wenig zu kompliziert, um in der Lage zu diskutieren, QnA-Website.
Shakti, Was empfehlen Sie mir?
Ich schlage vor, mit: link genau wie ich mich für diese Art von Arbeit. Code kann gelernt werden, dass neue Kontur aus beiden scans als Schriftarten. Ich verwende es selbst für Kennzeichen-Erkennung.
user2754599 - So verstehe ich es würde mir helfen zu erkennen, der text, toll! Aber wie die Konvertierung in durchsuchbares pdf?

InformationsquelleAutor msantiago | 2013-11-29

c#ocr pdf-generation tesseract tessnet2

2

Gibt es ein paar .NETTO-hOCR-zu-PDF-Bibliothek, die Sie möchten möglicherweise check-out bei Tesseract 3rdParty Seite.
- Schon sehr hilfreich, irgendwelche Beispiele zu deren Anwendung auf windows?
- hOcr2Pdf.NET Website hat einige code-Beispiel. Sie können Tesseract 3.x .NET wrapper, um die Ausgabe-hOCR-strings verwendet werden, die als input in die Bibliothek.
InformationsquelleAutor nguyenq

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.