Tessnet2 mit Tesseract-Engine - Warum gibt es sehr schlechte Ausgabe?

Ich versuche, mit der Tessnet2 mit Tesseract-engine in C#. Für viele der test-Bilder, die ich geben Tessnet2, der Ausgang ist sehr schlecht, und fast nichts ist richtig.

Dies ist mein code in C# - Konsole-Projekt-Programm.cs Klasse:

 static void Main(string[] args)
    {
        try
        {
        Bitmap image = new Bitmap(@"C:\Users\hp\Desktop\eurotext.tif");
        var ocr = new Tesseract();

        //when I tried to add the SetVariable(...), it didn't change the output much

        ocr.Init(@"C:\Program Files (x86)\Tesseract-OCR", "eng", true);

        var result = ocr.DoOCR(image, Rectangle.Empty);
        foreach (Word word in result)
            Console.WriteLine("{0} : {1}", word.Confidence, word.Text);

        Console.ReadLine();
    }
    catch (Exception exception)
    {
        Console.WriteLine("Error");
    }
}

Dies ist ein Beispiel für eine Probe (große binäre 300 dpi) test Bild "eurotext.tif":
Tessnet2 mit Tesseract-Engine - Warum gibt es sehr schlechte Ausgabe?

- Und dies ist die Tessnet2 Ausgabe für dieses Bild:
Tessnet2 mit Tesseract-Engine - Warum gibt es sehr schlechte Ausgabe?

Ich habe mit dieser website zu lernen, die Schritte zu verwenden Tessnet2:
https://code.msdn.microsoft.com/windowsdesktop/How-to-use-Tessnet2-library-716be12f

Hab ich diese website, um zu versuchen, richtig zu verwenden Sie die SetVariable (...) - Funktion, um es zu tun, was ich will, aber nicht mit Glück und nicht viel Unterschied in der Ausgabe:
http://www.sk-spell.sk.cx/tesseract-ocr-en

Fand ich den Tesseract-Richtlinien zur Reduzierung der Fehler der engine:
http://code.google.com/p/tesseract-ocr/wiki/ImproveQuality

  • heißt es "Tesseract funktioniert am besten mit text mit einem DPI-Wert von mindestens 300 dpi".. in diesem Beispiel-Bild ist in 300 dpi

  • diesem Beispiel-Bild ist auch binären, die geben sollten eine bessere Ausgabe, als wurde geraten, von vielen Menschen auf verschiedenen websites

Ich sah überall für eine Lösung, die zu einer Steigerung der Genauigkeit, und ich fand viele stellen und Menschen mit ähnlichen Problemen, aber keine funktionierende Lösung.

Was könnte der Grund sein für dieses problem? Wie kann ich es lösen?

Ich bin ein Anfänger in diesem Thema, also bitte Geduld mit mir, wenn die Lösung zu trivial.

Dank!

  • Ist die verwendete schriftart (.traineddata-Datei) entsprechend Ihrer Probe ? Vielleicht können Sie eine Weiße Liste (die Zeichen zu erkennen) zu geben, Tesseract bessere Vorschläge.
InformationsquelleAutor user1910524 | 2015-01-03
Schreibe einen Kommentar