Entfernen Hintergrundgeräusche aus dem Bild, um text klarer OCR

Ich habe eine Anwendung geschrieben, die Segmente eines Bildes auf der Grundlage der text-Regionen innerhalb es, und extrahiert den Regionen, so wie ich das sehe passen. Was ich versuche zu tun ist, reinigen Sie das Bild so, dass OCR (Tesseract) gibt ein genaues Ergebnis. Ich habe Folgendes Bild als Beispiel:

Läuft das durch tesseract gibt ein weit ungenauen Ergebnis. Jedoch die Reinigung der Bild (mit photoshop), um das Bild wie folgt:

Entfernen Hintergrundgeräusche aus dem Bild, um text klarer OCR

Gibt genau das Ergebnis, das ich erwarten würde. Das erste Bild ist bereits ausgeführt wird, durch die folgende Methode, um es sauber zu diesem Punkt:

 public Mat cleanImage (Mat srcImage) {
    Core.normalize(srcImage, srcImage, 0, 255, Core.NORM_MINMAX);
    Imgproc.threshold(srcImage, srcImage, 0, 255, Imgproc.THRESH_OTSU);
    Imgproc.erode(srcImage, srcImage, new Mat());
    Imgproc.dilate(srcImage, srcImage, new Mat(), new Point(0, 0), 9);
    return srcImage;
}

Was kann ich tun, um sauber das erste Bild so ähnelt es dem zweiten Bild?

Edit: das ist das original Bild, bevor es durch die cleanImage Funktion.

Entfernen Hintergrundgeräusche aus dem Bild, um text klarer OCR

Hi, wird sich so schnell wie möglich. Cheers.
Ich habe das original-image, bevor es verarbeitet.
Wenn man weiß, der text ist immer in etwa in der Mitte des Bildes, den Sie entfernen konnte angeschlossenen Segmente der dunklen Pixel, wo keine pixel in dem segment ist außerhalb einiger Entfernung von den Kanten. Wenn Sie weiß, daß der text immer die gleiche Größe, die Sie entfernen konnte angeschlossenen Segmente dunkler text, der weniger als einige Grenze für die Anzahl der Pixel in Ihnen. Wenn Sie Einklang das Bild irgendwie, und die zahlen sind alle die gleiche Höhe, die Sie könnten versuchen, und berechnen Sie eine Obere Zeile und eine untere Zeile und werfen Ausreißer. Wenn es immer 4 Ziffern, die Sie verwenden konnten zum entfernen von Segmenten größer als 4 auf einige Regel.
Sie können filter Rauschen Segmente (angeschlossene Komponenten) in der Nähe von Bildrändern (ich. e. verbunden mit image borders): in Ihnen Probe erforderlich text sind nicht an der Grenze.
Ist runitme wichtig, tatsächlich?

InformationsquelleAutor Zy0n | 2015-11-23

c++java ocr opencv

Meine Antwort basiert auf folgenden Annahmen. Es ist möglich, dass keiner von Ihnen hat in Ihrem Fall.

Es möglich für Sie zu verhängen ist, eine Schwelle für die bounding-box-Höhen in der segmentierten region. Dann sollten Sie in der Lage heraus zu filtern und anderen Komponenten.
Sie wissen, der Durchschnittliche Strichstärken der Ziffern. Verwenden Sie diese Informationen, um zu minimieren die Wahrscheinlichkeit, dass die Ziffern sind mit anderen Regionen. Sie können Distanz-Transformation und morphologische Operationen für diese.

Dies ist meine Vorgehensweise für die Extraktion der Ziffern:

Gelten Otsu Schwellwert auf das Bild
Distanz-Transformation
Schwelle der Abstand transformierte Bild mit dem Schlaganfall-Breite ( = 8) Einschränkung
Anwenden morphologische operation zu trennen
Filter bounding box Höhen und stellen Sie eine Vermutung auf, wo die Ziffern sind

stroke-width = 8
Entfernen Hintergrundgeräusche aus dem Bild, um text klarer OCR
stroke-width = 10

BEARBEITEN

Bereiten Sie eine Maske mithilfe der convexhull der gefunden Ziffer Konturen
Kopieren Ziffern region, um ein sauberes Bild mit der Maske

stroke-width = 8
Entfernen Hintergrundgeräusche aus dem Bild, um text klarer OCR

stroke-width = 10
Entfernen Hintergrundgeräusche aus dem Bild, um text klarer OCR

Meine Tesseract wissen ist ein wenig eingerostet. Soweit ich mich erinnere kann man eine confidence level für die Charaktere. Sie können in der Lage sein, heraus zu filtern, Lärm mit Hilfe dieser Informationen, wenn Sie immer noch passieren um zu erkennen, lauten Regionen als Charakter bounding-Boxen.

C++ - Code

Mat im = imread("aRh8C.png", 0);
//apply Otsu threshold
Mat bw;
threshold(im, bw, 0, 255, CV_THRESH_BINARY_INV | CV_THRESH_OTSU);
//take the distance transform
Mat dist;
distanceTransform(bw, dist, CV_DIST_L2, CV_DIST_MASK_PRECISE);
Mat dibw;
//threshold the distance transformed image
double SWTHRESH = 8;    //stroke width threshold
threshold(dist, dibw, SWTHRESH/2, 255, CV_THRESH_BINARY);
Mat kernel = getStructuringElement(MORPH_RECT, Size(3, 3));
//perform opening, in case digits are still connected
Mat morph;
morphologyEx(dibw, morph, CV_MOP_OPEN, kernel);
dibw.convertTo(dibw, CV_8U);
//find contours and filter
Mat cont;
morph.convertTo(cont, CV_8U);

Mat binary;
cvtColor(dibw, binary, CV_GRAY2BGR);

const double HTHRESH = im.rows * .5;    //height threshold
vector<vector<Point>> contours;
vector<Vec4i> hierarchy;
vector<Point> digits; //points corresponding to digit contours

findContours(cont, contours, hierarchy, CV_RETR_CCOMP, CV_CHAIN_APPROX_SIMPLE, Point(0, 0));
for(int idx = 0; idx >= 0; idx = hierarchy[idx][0])
{
    Rect rect = boundingRect(contours[idx]);
    if (rect.height > HTHRESH)
    {
        //append the points of this contour to digit points
        digits.insert(digits.end(), contours[idx].begin(), contours[idx].end());

        rectangle(binary, 
            Point(rect.x, rect.y), Point(rect.x + rect.width - 1, rect.y + rect.height - 1),
            Scalar(0, 0, 255), 1);
    }
}

//take the convexhull of the digit contours
vector<Point> digitsHull;
convexHull(digits, digitsHull);
//prepare a mask
vector<vector<Point>> digitsRegion;
digitsRegion.push_back(digitsHull);
Mat digitsMask = Mat::zeros(im.rows, im.cols, CV_8U);
drawContours(digitsMask, digitsRegion, 0, Scalar(255, 255, 255), -1);
//expand the mask to include any information we lost in earlier morphological opening
morphologyEx(digitsMask, digitsMask, CV_MOP_DILATE, kernel);
//copy the region to get a cleaned image
Mat cleaned = Mat::zeros(im.rows, im.cols, CV_8U);
dibw.copyTo(cleaned, digitsMask);

BEARBEITEN

Java-Code

Mat im = Highgui.imread("aRh8C.png", 0);
//apply Otsu threshold
Mat bw = new Mat(im.size(), CvType.CV_8U);
Imgproc.threshold(im, bw, 0, 255, Imgproc.THRESH_BINARY_INV | Imgproc.THRESH_OTSU);
//take the distance transform
Mat dist = new Mat(im.size(), CvType.CV_32F);
Imgproc.distanceTransform(bw, dist, Imgproc.CV_DIST_L2, Imgproc.CV_DIST_MASK_PRECISE);
//threshold the distance transform
Mat dibw32f = new Mat(im.size(), CvType.CV_32F);
final double SWTHRESH = 8.0;    //stroke width threshold
Imgproc.threshold(dist, dibw32f, SWTHRESH/2.0, 255, Imgproc.THRESH_BINARY);
Mat dibw8u = new Mat(im.size(), CvType.CV_8U);
dibw32f.convertTo(dibw8u, CvType.CV_8U);

Mat kernel = Imgproc.getStructuringElement(Imgproc.MORPH_RECT, new Size(3, 3));
//open to remove connections to stray elements
Mat cont = new Mat(im.size(), CvType.CV_8U);
Imgproc.morphologyEx(dibw8u, cont, Imgproc.MORPH_OPEN, kernel);
//find contours and filter based on bounding-box height
final double HTHRESH = im.rows() * 0.5; //bounding-box height threshold
List<MatOfPoint> contours = new ArrayList<MatOfPoint>();
List<Point> digits = new ArrayList<Point>();    //contours of the possible digits
Imgproc.findContours(cont, contours, new Mat(), Imgproc.RETR_CCOMP, Imgproc.CHAIN_APPROX_SIMPLE);
for (int i = 0; i < contours.size(); i++)
{
    if (Imgproc.boundingRect(contours.get(i)).height > HTHRESH)
    {
        //this contour passed the bounding-box height threshold. add it to digits
        digits.addAll(contours.get(i).toList());
    }   
}
//find the convexhull of the digit contours
MatOfInt digitsHullIdx = new MatOfInt();
MatOfPoint hullPoints = new MatOfPoint();
hullPoints.fromList(digits);
Imgproc.convexHull(hullPoints, digitsHullIdx);
//convert hull index to hull points
List<Point> digitsHullPointsList = new ArrayList<Point>();
List<Point> points = hullPoints.toList();
for (Integer i: digitsHullIdx.toList())
{
    digitsHullPointsList.add(points.get(i));
}
MatOfPoint digitsHullPoints = new MatOfPoint();
digitsHullPoints.fromList(digitsHullPointsList);
//create the mask for digits
List<MatOfPoint> digitRegions = new ArrayList<MatOfPoint>();
digitRegions.add(digitsHullPoints);
Mat digitsMask = Mat.zeros(im.size(), CvType.CV_8U);
Imgproc.drawContours(digitsMask, digitRegions, 0, new Scalar(255, 255, 255), -1);
//dilate the mask to capture any info we lost in earlier opening
Imgproc.morphologyEx(digitsMask, digitsMask, Imgproc.MORPH_DILATE, kernel);
//cleaned image ready for OCR
Mat cleaned = Mat.zeros(im.size(), CvType.CV_8U);
dibw8u.copyTo(cleaned, digitsMask);
//feed cleaned to Tesseract

Ein paar Dinge zu beachten: es ist nicht etwa nur Ziffern; Das minus muss auch erkannt werden; Erkannt Elemente müssen zusammengeführt werden in einem Bild als Quelle für tesseract.
Ich aktualisiert meine Antwort mit Modifikationen nötig, um ein sauberes Bild.
Möchte ich meine Lösung, wie auch später auf. Seine blob-basierten und weniger code. +1
Vielen Dank für diese. Mein C++ ist nicht so toll. Ich habe implementiert, diese Lösung in Java nur bei der Erstellung der Maske mit convexHull bieten nicht die gleichen Ergebnisse erzielen, wie Sie oben dargestellt ist. Ich habe den code hier: pastebin.com/KfYFu1vk
Ich habe nicht verwendet OpenCV mit Java. Ich habe es modifiziert Ihren code, um die nach meinem besten wissen. Weiß nicht, ob es kompiliert. Bitte achten Sie auf die Anmerkungen, die ich Hinzugefügt habe, und du wirst wissen, was zu tun ist, falls es ein problem gibt. code
Fantastisch! Edit gearbeitet, genau wie beschrieben.hank Sie für diese aufschlussreiche und ausführliche Antwort.
ich möchte die Implementierung in iOS also, wenn jemand helfen kann, wird es spürbar
ich möchte die Implementierung in iOS und es wird spürbar, wenn ich anyhelp
gut, ich habe keine Erfahrung mit iOS. welche Art von Hilfe möchtest du? sieht opencv wird vollständig unterstützt, auf iOS.
Jemand eine funktionierende Java-code? Code teleologische zählen nur eine Kontur

InformationsquelleAutor dhanushka

5

Ich denke, Sie müssen mehr arbeiten auf dem pre-processing Teil vorzubereiten, das Bild klar zu sein, so viel wie Sie können, bevor der Aufruf von tesseract.

Was von meinen Ideen zu tun, sind die folgenden:

1 - Extrahieren Sie die Konturen aus dem Bild und finden Sie die Konturen im Bild (check diese) und diese

2 - die Einzelnen Konturen haben Breite, Höhe und Fläche, so filtern Sie die Konturen nach, um der Breite, der Höhe und seine Umgebung (check diese und diese), plus benutzen, können Sie einen Teil der Kontur-Analyse code hier zu filtern, die Konturen und vieles mehr können Sie löschen die Konturen sind nicht vergleichbar mit einem "Buchstabe oder Zahl" Kontur mit einer Schablone die Kontur-matching.

3 - Nach dem filtern der Kontur können Sie überprüfen, wo sind die Buchstaben und die zahlen in diesem Bild, so müssen Sie möglicherweise verwenden Sie einigen text-detection-Methoden wie hier

4 - Alle was Sie brauchen, jetzt, wenn zum entfernen der nicht-text-Bereich, und die Konturen sind nicht gut aus das Bild

5 - Jetzt können Sie Ihre binirization Methode oder Sie können die tesseract one zu tun, die binirization auf das Bild, dann rufen Sie die OCR auf dem Bild.

Sicher, dass diese sind die besten Schritte, um dies zu tun, können Sie einige von Ihnen und kann es genug für Sie.

Andere Ideen:
- Benutzen, können Sie verschiedene Möglichkeiten, dies zu tun ist die beste Idee ist, einen Weg zu finden, zu erkennen, die Zahl und der Standort der Figur, die mit anderen Methoden wie template-matching oder feature-basiert wie SCHWEIN.
- Können Sie zunächst zu tun Binarisierung auf Ihr Bild und bekommen das binäre Bild, dann bewerben Sie sich öffnen mit line-Strukturfonds für die horizontale und die vertikale und dies wird Ihnen helfen, zu erkennen, die Kanten nach, und das tun die Segmentierung auf das Bild, dann die OCR-Funktion.
- Nach erkennen der Konturen im Bild, Sie können auch Hough transformation zu erkennen, jede Art von Linie und Kurve definiert, wie dies ein, und auf diese Weise können Sie erkennen, dass die Zeichen, die sind gefüttert, so können Sie segmentieren das Bild und führen Sie die OCR danach.
Viel einfacheren Weg:

1 - binirization

2 - Einige Morphologie Betrieb zu trennen, die Konturen:

3 - Inverse die Farbe im Bild ist (kann vor Schritt 2)

4 - Finden Sie alle Konturen im Bild

5 - Löschen Sie alle Konturen, die Breite ist mehr als hoch ist, löschen Sie die sehr kleine Konturen, die sehr hoch sind, und die kein Rechteck Konturen

Hinweis : Sie dürfen den text detection-Methoden (oder mit SCHWEIN-oder edge-detection) anstelle von Schritt 4 und 5

6 - Finden Sie die große Rechteck, das enthält alle übrigen Konturen im Bild

7 - Sie können tun, einige zusätzliche pre-processing zu verbessern, die den input für die tesseract dann können Sie rufen Sie die OCR-jetzt. (Ich rate Ihnen, das Bild zuzuschneiden und es als ein input für die OCR - [ich meine-Ernte des gelben Rechtecks, und machen Sie nicht das gesamte Bild als input gerade das gelbe Rechteck und verbessern die Ergebnisse auch])

InformationsquelleAutor Hazem Abdullah
1

Wäre das Bild Ihnen helfen?

Der Algorithmus produziert, dass Bild wäre einfach zu implementieren. Ich bin sicher, wenn Sie zwicken einige der Parameter, können Sie sehr gute Ergebnisse für diese Art von Bildern.

Getestet habe ich alle Bilder mit tesseract:
- Original-Bild : Nichts erkannt
- Bearbeitete Bild #1 : Nichts erkannt
- Bearbeitete Bild #2 : 12-14 (exact match)
- Mein bearbeitet Bild : y'1'2-14/j
- Haben Sie versucht tesseract nach dem entfernen der angeschlossenen Komponenten an den Rändern? Da in Ihrem Bild, werden die angeschlossenen Komponenten an den Rändern nicht mit dem text entfernen, die möglicherweise bessere Ergebnisse liefern.
- Du hast Recht! Es wird definitiv bessere Ergebnisse erzielen, wenn die angeschlossenen Strukturen werden entfernt. Am Punkt des posting, das Bild, das ich nicht bewusst von dieser Tatsache. Ich thouht tesseract war stark genug, um das allein tun, und es wäre genug, um einfach zu entfernen Rauschen und andere Artefakte in zwischen den Ziffern. Ich entwickle eine Erweiterung dieses Algorithmus, die macht es einfach, wird aber loswerden, dass die grenzüberschreitenden Strukturen. Prost!
- Auch, können Sie fügen Sie Ihren Algorithmus, um die Antwort?
- Tesseract kann schwierig sein. Versuchen Sie tesseract -psm 7 yourimage.png digits wird die Kraft von tesseract erkennt nur Ziffern. Könntest du bitte posten Sie Ihre Methode zur Reduzierung der Bild oben?
- Ja ofc-ich poste den code. Ich haben es nur theoretisch und umzusetzen und poste es später. Außerdem wäre es interessant zu sehen, wenn wir lösen Ihr problem mit größeren Strukturen zufällig verteilt in der Bild (Nicht nur verbunden, bis an die Grenzen).
InformationsquelleAutor MarkusAtCvlabDotDe
0

Nur ein wenig zu denken, out of the box:

Kann ich sehen, von Ihrem ursprünglichen Bild, dass es ein ziemlich rigoros vorformatierte Dokument, sieht aus wie eine KFZ-Steuer-Ausweis oder sowas, richtig?

Wenn die Annahme oben richtig ist, dann könnte man implementieren, die eine weniger generische Lösung: Der Lärm, den Sie versuchen, um loszuwerden, ist durch Merkmale der spezifischen Dokument-Vorlage, es tritt in bestimmten, bekannten Regionen des Bildes. In der Tat, nicht so der text.

In diesem Fall eine der Möglichkeiten, darüber zu gehen ist, definieren die Grenzen der Regionen, in denen Sie wissen, dass es so "Rauschen" und nur weiß Sie Sie heraus.

Dann Folgen Sie den rest der Schritte, die Sie bereits Folgendes: die noise reduction", um die feinsten Details (z.B. die hintergrund-Muster, das aussieht wie die Sicherheit, Wasserzeichen oder Hologramm in den Abzeichen). Das Ergebnis sollte klar sein, genug für Tesseract zu verarbeiten, ohne Probleme.

Nur ein Gedanke sowieso. Nicht eine generische Lösung, ich erkennen an, dass, also es hängt davon ab, was Ihre tatsächlichen Bedürfnisse sind.

InformationsquelleAutor Yannis Douros
0

Die Schriftgröße sollte nicht so groß sein oder klein, etwa im Bereich von 10-12 pt(der ich.e -, Zeichen-Höhe etwa über 20 und weniger als 80). Sie können sich eine Probe von der Bild und versuchen Sie es mit tesseract. Und einige Schriftarten sind nicht geschult im tesserakt, das Problem kann entstehen, wenn es nicht in diesem ausgebildet Schriften.

InformationsquelleAutor Gowthaman

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.