Benutzerwörterbuch für Tesseract

Ich arbeite derzeit an einem Projekt für android-mit tesseract-OCR. Ich hatte gehofft, um die Feinabstimmung der Ergebnisse an die Benutzer, indem ein Wörterbuch. Nach http://code.google.com/p/tesseract-ocr/wiki/FAQ , der beste Weg zu gehen über diese wäre

Ersetzen tessdata/eng.Benutzer-Worte mit Ihrem eigenen Wortliste, in die gleichen
format UTF - 8 text, ein Wort pro Zeile.

Allerdings gibt es keine eng.Benutzer-Wörter-Datei in der tessdata Ordner, ich gehe davon aus, dass, wenn ich nur eine text-Datei mit meinem Wörterbuch in es, es wird nie verwendet werden..

Hatte hat jemand eine ähnliche Erfahrung und weiß was zu tun ist? Jeder Rat wäre eine große Hilfe.

InformationsquelleAutor TomSelleck | 2012-03-05
Schreibe einen Kommentar