Tesseract SetVariable tessedit_char_whitelist in einer anderen Sprache

Tesseract setVariable-whitelist funktioniert ok, für englische Sprache, zum Beispiel nutze ich dies, um zu erkennen, nur Ziffern und Buchstaben aus dem Bild ein (ohne Sonderzeichen &*^%! etc)

_ocr.SetVariable("tessedit_char_whitelist",
"0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ");

Aber ich kann das nicht tun das gleiche für die Thailändische Sprache

_ocr.SetVariable("tessedit_char_whitelist","0123456789กขคงจฉ");

Ist es ein anderes Prinzip? Da dies nicht funktioniert. Statt bestimmt alle Zeichen, die ich erhalten nur die Ziffern in der Ausgabe, tesseract ignoriert alle Thai-Buchstaben, die ich in der whitelist.

Wie kann ich pass diese variable richtig?

InformationsquelleAutor best | 2013-04-30
Schreibe einen Kommentar