Zeichenerkennung (OCR-Algorithmus)

Arbeite ich an einem Projekt, in dem ich zu entwickeln, OCR-Algorithmus ( ich habe den text zu Lesen von Bild und konvertieren Sie Sie dann in andere Sprache ).Also meine erste Aufgabe ist es, text aus Bild.

Schritten bis zur ersten Aufgabe.

  1. Laden alle Bildformate (bmp, jpg, png) aus gegebenen Quelle. Dann konvertieren Sie das Bild in Graustufen und beispielsweise binarisieren es mit dem Schwellenwert (Otsu-Algorithmus). //abgeschlossen(so entfernen Sie Rauschen aus Ausgabe Bild???)

Ergebnisse

Zeichenerkennung (OCR-Algorithmus)

Zeichenerkennung (OCR-Algorithmus)

  1. Erkennung von image-Eigenschaften wie Auflösung und inversion. Damit können wir schließlich die Umrechnung auf eine begradigte Bild für die weitere Verarbeitung. (abgeschlossen den code der Drehung des Bildes, aber nicht in der Lage zu erkennen Bildwinkel über, die wir haben, um das Bild zu drehen,Also noch auf Arbeit-Winkel-Erkennung Teil)

  2. Linien-Erkennung und-Beseitigung. Dieser Schritt ist erforderlich, um die Seite layout-Analyse, um eine bessere Qualität der Erkennung ist für unterstrichenen text, um zu erkennen, Tabellen, usw. ein.(Beschlossen Komplett-Teil am Ende)

  3. Seite-layout-Analyse. In diesem Schritt versuche ich, den text identifiziert Zonen im Bild vorhanden. So, dass nur der Teil verwendet wird, für die Anerkennung und den rest der region ausgelassen wird.

  4. Erkennung von text, Linien und Wörter. Hier müssen wir auch aufpassen, verschiedenen Schriftgrößen und kleine Räume zwischen den Wörtern.

  5. Anerkennung von Zeichen. Dies ist der wichtigste Algorithmus der OCR; ein Bild von jedem Charakter konvertiert werden müssen, um die entsprechenden Zeichen-code. Manchmal wird dieser Algorithmus erzeugt verschiedene Charakter-codes für ungewisse Bilder. Zum Beispiel, die Anerkennung des Bildes der "ich" - Charakter erzeugen kann "ich", "|" "1", "l" - codes und das endgültige Zeichen-code ausgewählt wird später.

  6. Speichern der Ergebnisse zu ausgewählten Ausgabeformat, zum Beispiel durchsuchbares PDF, DOC, RTF, TXT. Es ist wichtig, bewahren Sie die original-Seiten-layout: Spalten, Schriftarten, Farben, Bilder, hintergrund und so weiter.

So, ich benötige Hilfe bei der part6.Ich habe abgeschlossen, line-detection-Teil (get-n-Bilder aus einem Absatz mit n Zeilen) aber stecken in nächsten Teil bekommen, Wörter und Zeichen recognisation.Wenn Sie wissen, gute links zu OCR und Charakter recognisation Teil dann bitte Hier posten.

Charakter recognisation ich bin am überlegen zu verwenden asprise(Java-Bibliothek) http://asprise.com/product/ocr/index.php?lang=java

InformationsquelleAutor der Frage TLE | 2013-03-03

Schreibe einen Kommentar