Wie man die Koordinaten der erkannten Zeichen
Habe ich eine sehr einfache OCR-app basiert auf Tesseract. Nach der Anerkennung
Schritt, ich habe auch einen Benutzer-Verifizierungs-Schritt, der es ermöglicht, die Korrektur
bei OCR ist falsch. Die Verbesserung der Benutzeroberfläche, die ich Plane zu zeichnen
Rechteck auf der Oberseite des OCR-ed-Zeichen auf der original input image,
und legte Sie nebeneinander mit der OCR-Ausgabe. Man kann, muss ich
die Koordinaten der erkannten Zeichen.
Habe ich versucht, etwas wie dies, aber es scheint mir unsinnig:
ETEXT_DESC output;
tess->Recognize(&output);
text = tess->GetUTF8Text();
Nun, wenn ich Zugriff auf Ausgang->Graf, es gibt mir einen gewissen Wert über 10.000,
und das ist offensichtlich falsch, weil das ganze Bild hat nur 20 oder so Zeichen.
Bin ich auf dem richtigen Weg? Kann ich haben einige Richtung bitte?
Du musst angemeldet sein, um einen Kommentar abzugeben.
Vielleicht ist es hilfreich, die Koordinaten der Boxen.
Versuchen Sie die ausführbare Datei des tesserakt. Verwenden Sie den Befehl
Schließlich bekommen Sie die Koordinaten der einzelnen Zeichen, einen pro Zeile. Dann sind Sie in der Lage zu vergleichen.
Den
tesseract
ausführbare Datei hat eine option hocr Ausgabe Zeichen erkannt und Ihre Koordinaten in html - format. Um dies programmatisch, die FAQ sagt zu findenbaseapi.h
.