Seite-layout-Analyse mit Hilfe von Tesseract?
Tesseract 3 durchführen Seite-layout-Analyse. Allerdings konnte ich keinen Beispielcode oder eine Dokumentation, wie die Bibliothek zu benutzen für solche Zwecke. Ich hoffe das hier jemand erklären kann, wie Sie führen layout-Analyse in einem Bild auf, wie zu analysieren der daraus resultierenden Daten.
Du musst angemeldet sein, um einen Kommentar abzugeben.
Tesseract können gegeben werden, eine Seite-Modus-parameter (
-psm
) haben die folgenden Werte:0
= Ausrichtung und Skript-Erkennung (OSD) nur.1
= Automatische Seiten-Segmentierung mit OSD.2
= Automatische Seite Segmentierung, aber kein OSD, oder OCR -3
= Vollautomatische Seite Segmentierung, aber kein OSD. (Standard)4
= Annehmen, eine einzelne Spalte von text unterschiedlicher Größe.5
= Übernehmen, um einen einheitlichen block, der sich vertikal ausgerichteten text.6
= Übernehmen, um einen einheitlichen Textblock.7
= Behandeln das Bild als eine einzelne Textzeile.8
= Behandeln das Bild wie ein einzelnes Wort.9
= Behandeln das Bild wie ein einzelnes Wort in einem Kreis.10
= Behandeln das Bild wie ein einzelnes Zeichen.Beispiel:
Allerdings bin ich mir nicht sicher, dass es möglich ist, verwenden Sie die layout-Analyse im standalone-Modus.
Zuerst initialisieren
TessBaseAPI
Instanz. Sie können entwederInit()
(wenn Sie möchten, um weitere text-Erkennung) oderInitForAnalysePage()
(wenn Sie interessiert sind nur in text-Boxen).Zweitens, das Bild mit
SetImage()
.Und schließlich rufen
AnalyseLayout()
zu bekommenPageIterator
bietet Ihnen mit Textfeldern.Nicht sicher, ob das genau deine Frage beantworten, aber ich landete hier auf der Suche nach Möglichkeiten, um die bbox-Koordinaten info (text und anerkannt innerhalb der bbox Optional) gegeben ein input-Bild. Die Lösung ist jetzt möglich mit tesseract.
Den params zu bemerken, im obigen code-snippet gibt 'psm' und 'tsv'. 'psm' wählt die Seite Segmentierung Modus und 'tsv' erzeugt eine schöne tabellarische Ausgabe-Datei mit allen Informationen (page-block-line-Nummer, bbox coods, Vertrauen, Vorhersagen text) müssten Sie auf Ihre text-Bild (siehe unten)
Gibt es eine option sein, da 3.04:
Hier ist eine Referenz auf, was aussieht wie die im Zusammenhang mit Entwicklung, thread.