tesserakt (.NET) + durchsuchbare PDF-Datei. Wie bewerben Sie sich?

Habe ich das Bedürfnis, ein system zu entwickeln, das verwandelt ein Bild in eine durchsuchbare PDF-Datei.
Wie ist eine Schule arbeite, brauche ich etwas mit open source
Nach viel Forschung fand ich tessnet2 (tesseract) und ich kann Sie löschen einen text, wird das Bild im tiff-format.
Aber wie konvertieren diese Informationen in einer PDF-Datei?
Achtung : ich brauche, um die Datei-Struktur.

Brauche ich eine Richtung zu gehen mit meiner Forschung. Mir bitte jemand helfen.

danke

  • Ich denke, in der Lage sein, dies zu tun müssten Sie ein OCR-Bibliothek, die würde der job für Sie tun. Es ist ein wenig zu kompliziert, um in der Lage zu diskutieren, QnA-Website.
  • Shakti, Was empfehlen Sie mir?
  • Ich schlage vor, mit: link genau wie ich mich für diese Art von Arbeit. Code kann gelernt werden, dass neue Kontur aus beiden scans als Schriftarten. Ich verwende es selbst für Kennzeichen-Erkennung.
  • user2754599 - So verstehe ich es würde mir helfen zu erkennen, der text, toll! Aber wie die Konvertierung in durchsuchbares pdf?
InformationsquelleAutor msantiago | 2013-11-29
Schreibe einen Kommentar