Wie man die Koordinaten der erkannten Zeichen

Habe ich eine sehr einfache OCR-app basiert auf Tesseract. Nach der Anerkennung
Schritt, ich habe auch einen Benutzer-Verifizierungs-Schritt, der es ermöglicht, die Korrektur
bei OCR ist falsch. Die Verbesserung der Benutzeroberfläche, die ich Plane zu zeichnen
Rechteck auf der Oberseite des OCR-ed-Zeichen auf der original input image,
und legte Sie nebeneinander mit der OCR-Ausgabe. Man kann, muss ich
die Koordinaten der erkannten Zeichen.

Habe ich versucht, etwas wie dies, aber es scheint mir unsinnig:

   ETEXT_DESC output;
   tess->Recognize(&output);
   text = tess->GetUTF8Text();

Nun, wenn ich Zugriff auf Ausgang->Graf, es gibt mir einen gewissen Wert über 10.000,
und das ist offensichtlich falsch, weil das ganze Bild hat nur 20 oder so Zeichen.

Bin ich auf dem richtigen Weg? Kann ich haben einige Richtung bitte?

InformationsquelleAutor Haoest | 2011-09-06
Schreibe einen Kommentar