Tesseract-training für eine neue schriftart

Ich bin noch neu auf Tesseract-OCR und nachdem er es in mein script es bemerkt hatte, eine relativ große Fehlerquote für die Bilder, die ich versuchte, zu extrahieren text aus. Ich kam über Tesseract Ausbildung, die angeblich in der Lage sein würde, zu verringern, error rate für eine bestimmte schriftart, die Sie verwenden würden. Ich stieß auf eine website ( http://ocr7.com/ ), das ein Werkzeug ist angetrieben von Anyline, alles zu tun, die Ausbildung für eine schriftart, die Sie angeben. So erhielt ich eine .traineddata-Datei und ich bin mir nicht ganz sicher, was damit zu tun. Könnte jemand erklären, was ich zu tun habe mit dieser Datei, damit es funktioniert? Oder sollte ich einfach lernen, wie man Tesseract Ausbildung die manuelle Methode, die nach dem Anyline website können die Arbeit eines Tages. Vielen Dank im Voraus.

InformationsquelleAutor user19235 | 2016-12-23
Schreibe einen Kommentar