Bildvorverarbeitung vor der OCR-Prozess

Mein Aktuelles Projekt umfasst Transkriptionen von Texten in pdf-Dateien in text-Dateien, und ich zuerst versucht, indem Sie die Bild-Datei direkt in das OCR-Programm (tesseract) und es nicht' gut tun.
Die original-Bilddateien sind alte Zeitungen, im Grunde, und haben einige hintergrund-Geräusche, die ich bin sicher, dass tesseract hat problem mit. Also ich bin versucht, einige Bild-Vorverarbeitung vor der Einspeisung in tesseract. Ist es eine Anregung für die open-source-bildvorverarbeitung-Motor passt gut zu dieser situation??? Und Anweisungen, wie es zu verwenden wäre, noch mehr zu schätzen !

InformationsquelleAutor Sardonic | 2013-03-21
Schreibe einen Kommentar