Training tesseract für die Verwendung mit iPhone
Ich versuche, mit tesseract-2.04 in meinem iPhone-Anwendung und wollen einfach nur zu erkennen, die zahlen. Was ich hier mache ist erste ich bin cross-Compilierung tesseract zu generieren lib-Datei mit diesem post http://robertcarlsen.net/2009/07/15/cross-compiling-for-iphone-dev-884 und dann mit der demo-Anwendung auf http://robertcarlsen.net/2010/01/12/ocr-for-iphone-source-1080 , aber die Ergebnisse weit entfernt, als realistisch.
Ich bin nicht in der Lage, das Problem zu beheben oder wie trainieren von tesseract, so dass es kommt-Verschluss für die praktische Anwendung.
Bitte helfen.
Dank,
Madhup
- Gibt es eine bestimmte Reihe von zahlen, die Sie versuchen zu erkennen? Wie eine bestimmte schriftart? oder einfach nur generische "zahlen erkennen".
- Die app erkennt eine bestimmte schriftart sehr gut, ich will einfach nur, um die app in der Lage zu verstehen, mehr Schriftarten und für die, die ich brauche, um Schriftarten hinzufügen, ich bin nicht in der Lage, herauszufinden, wie ich hinzufügen sollte, diese Schriftarten und das format der Schriften.
- Es ist eine ziemlich detaillierte version, wie tesseract zu trainieren, allerdings habe ich nicht mitgemacht, den Prozess so bin ich nicht so eine Antwort. Es scheint sehr stark code.google.com/p/tesseract-ocr/wiki/TrainingTesseract Haben Sie sah durch es bei der Generierung von neuen Trainings-Zeichen?
- Wenn Sie nichts dagegen haben den Aufruf eines externen web-API für die OCR-Funktion anstelle der Verwendung von Tesseract gibt es eine API, die speziell optimiert für mobile Geräte Kameras / Bilder mit geringer Qualität: Die WiseTrend OCR-API ( wisetrend.com/wisetrend_ocr_cloud.shtml , melden Sie sich an webservius.com/cons/subscribe.aspx?p=wisetrend&s=wiseocr ) - es basiert auf der ABBYY-engine.
Du musst angemeldet sein, um einen Kommentar abzugeben.
Bekomme ich ziemlich gute Ergebnisse Einstellung
während sanft drängen den Benutzer zu lassen, die zahlen passen in eine bestimmte box. Dies macht das Auffinden der zahlen ist einfacher für mich, und garantiert dem Benutzer hält das Bild stabil und in einem angemessenen Abstand führt zu einem schärferen Bild.
Habe ich gedacht, über das ändern valid_word() in tesseract-2.04/dict/permute.cpp, aber es scheint auch keine Notwendigkeit dafür.
Der nächste Schritt wird sein, zu fest ein minimum/maximum der char so groß ist die Anerkennung der Zeit können sich so weniger als die 500 ms es jetzt ist. Dann ist der nächste Schritt wird es sein, fügen Sie einige code, der Spur hält der Ergebnisse in der Zeit, so dass das Lesen
5
90% der Zeit8
nur 10% führen wird, den code zu erinnern, die5
.Kommt es auf den Anwendungsfall, die Sie haben. Ich bin glücklich in dem Sinne, dass ich erlaubt bin, nur zeigen, ein 200x50-box, die enthält die Anzahl.