Tesseract - Sprache ändern Speicherort der Datei
Mache ich ein AIR-Projekt, die brauchen einige OCR-Fähigkeiten, so dass ich mich entschieden habe, tesseract (jetzt versuche ich, um es arbeiten auf Windows).
Mein problem ist, das kann nicht ändern Sie den Speicherort der Sprachdatei - es ist immer versucht, in meinem Tesseract-Installationsverzeichnis (program files (x86)\Tesseract-OCR\tessdata\mylang.traineddata)
Gibt es eine Möglichkeit, dass ich konfigurieren kann Tesseract zu suchen für diese Datei, wo ich angeben? zum Beispiel in den gleichen Ordner wie tesseract.exe. Ich möchte nicht (oder vielleicht Ereignis kippe) installieren Sie eine Anwendung mit dem AIR-Installationsprogramm. Ich hab es mit der 3.0 version und die neueste SVN-version.
Dank
Du musst angemeldet sein, um einen Kommentar abzugeben.
Ja, können Sie, indem Sie die TESSDATA_PREFIX Umgebungsvariable, z.B.:
export TESSDATA_PREFIX=/usr/local/share/
Beachten Sie, dass der Pfad muss enden /.
Ich habe das problem gelöst durch umschreiben des Quellcodes von Tesseract (im mit SVN 597). Als nguyenq sagte, Tesseract versucht, für die Daten auf dem Pfad durch die TESSDATA_PREFIX Umgebungsvariable. Wenn diese nicht gefunden, dann hat es ein paar Tricks, die ich nicht verstehe 🙂 .
Also, wenn jemand braucht eine portable version von Tesseract (das ist nicht abhängig von einem Tesseract-installation) Bearbeiten mainblk.cpp um die Zeile 60, dies ist meine version:
Nun können Sie packen die Dinge in der "tesserakt Pfad der ausführbaren Datei"\tessdata Verzeichnis
ich schlage vor, Sie nicht behandeln, tessdata Pfad durch TESSDATA_PREFIX. Sie können festlegen, tessdata Pfad im init-tesseract. Wenn Sie tesseract.exe in der Befehlszeile verwenden Sie folgende syntax:
wenn Sie tesseract::TessBaseApi, in der api.init() init wie folgt: