Lesen von Zeichen aus einem Bild
Arbeite ich an einer Anwendung, die erfordert Abgleich von zahlen aus einem gescannten image-Datei auf Datenbank-Eintrag und aktualisieren Sie die Datenbank mit dem gleichen Ergebnis.
Sagen, ich habe Bild - employee1.jpg. Dieses Bild soll zwei zwei handschriftliche Einträge - Mitarbeiter-Anzahl und den Betrag an den Mitarbeiter ausgezahlt werden. Ich Lesen Sie die Mitarbeiter-Zahl aus dem Bild und Abfragen der Datenbank, für die diese Zahl haben, aktualisieren die Mitarbeiter mit den zu zahlenden Betrag, wie von der Bild. Sowohl die Mitarbeiter-Anzahl und den zu zahlenden Betrag sind geschrieben und in zwei Boxen an einem bestimmten Ort auf dem Bild.
Gibt es eine Möglichkeit, dies zu automatisieren. Im Grunde möchte ich eine Lösung .net mit c#. Ich weiß, das getan werden kann mithilfe von künstlichen neuronalen Netzwerken.
Irgendwelche Ideen würde sehr geschätzt.
Du musst angemeldet sein, um einen Kommentar abzugeben.
Können Sie mithilfe von Microsoft Office Document Imaging Library (MODI), die sich in der Office 2003/2007.
Links:
Projekt - Beispiel für die Verwendung von MODI
Wikipedia - enthält ein einfaches
Beispiel in VB.NET
Mustererkennung ist ein basic Beispiel, wenn neuronale Netzwerke untersucht. Ich weiß nicht, ob irgendeine Bibliothek/framework für die Arbeit mit AI in C#. Wenn Sie finden, eine, erste Sie tun müssen, ist die Bahn das Netz (überwachtes lernen) und für diese müssen Sie bereiten eine große Stichprobe von Bildern; weitere Beispiele -> Ergebnis genauer. In der anderen hand können Sie verwenden OpenCV (C/C++, Python und Java), die eine spezialisierte Bibliothek in der computer vision und hat ein Modul zur Implementierung der KI-Methoden.
Haben einen schönen Tag!
Oscar.
Ich denke, das ist sehr schwer zu automatisieren. Das problem ist nur, da müssen Sie irgendeine Art von sehr gute OCR-software. Und selbst wenn man das, was ist, wenn er liest etwas falsch, Ursache des frouzy Handschrift von jemand? Wenn die ID falsch ist, die bezahlt ist gebucht, um die falschen Mitarbeiter, und wenn der Betrag falsch ist, er habe die falsche Gehalt!
Sind beide Dinge, die Sie nicht wirklich passieren. Nur um Ihnen zu zeigen, wie schwer eine gute ocr zu finden ist, nehmen Sie nur einen Blick auf, wie ein captcha funktioniert. Das Prinzip ist nichts weiter als ein Bild von einem schwer, den text zu Lesen.
Also meine Meinung wäre, dass Sie nicht wirklich diesen Prozess automatisieren. Zumindest kann man ein Programm schreiben, um bei einem Menschen durch die Eingabe der Werte manuell (werfen Sie auch einen Blick auf Amazon Mechanical Turk):
Dieses zu erhalten, um einen schnellen und reibungslosen Ablauf, müssen Sie sehr darauf achten über wie kann der Benutzer geben Sie einfach die Werte, die nur mit der Tastatur:
Durch die Verwendung solcher Prozess kann auch nur eine person geben viele Einträge in der Datenbank und die Kosten sind viel billiger als die Suche nach falschen Einträgen in der Datenbank danach.
Nur ein letzter Vorschlag:
Ursache dafür ist eine langweilige Prozess für Menschen, die leicht zu einem Fehler führt, vielleicht lassen zwei Menschen, die diese Werte eingeben, und nur wenn beide in die gleiche, als nehmen Sie diesen Wert als genehmigt. Dies sollte dazu führen, einen richtigen Kurs irgendwo über 99%. Wenn Sie müssen absolut 100% denken über Vermietung 4-5 Personen überprüfung, ein Eintrag-und nur, wenn alle von Ihnen geben Sie die gleichen Werte nehmen es als genehmigt. Um auch einen Vergleich darüber, wie gut Ihre ocr-software wäre, lass es einfach laufen auch über Ihre Bilder und vergleichen diese Ergebnisse auf den menschlichen eingegebenen Werte, um eine Vorstellung zu bekommen, wenn Sie können wirklich verlassen sich auf Ihre ocr nur.
OCR-engines sind nicht ausgebildet, um zu Lesen handgeschriebener text, so dass Sie möglicherweise Schwierigkeiten haben, mit MODI. Sie wollen versuchen zu finden eine ICR-engine. Auch so, die besten von Ihnen sind nur 80% genau auf gute inputs. Sie könnten besser, weil Sie wissen, dass Sie Ihren text immer zahlen.
Diesem ALSO Frage/Antwort sagt, dass OCROpus hat ICR
FOSS Intelligent Character Recognition (ICR)
Gibt es SDK-LeadTools OCR/ICR. Dies ist sehr nützlich bei der Erkennung der handschriftlichen Zeichen. Ich bin dabei eine feasibilty-Studie mit dieser, und bis jetzt denke ich klappt es. leadTools zur Verfügung gestellt haben Komponenten, die in Ihrer Anwendung verwendet werden, es unterstützt C, C++, C#, VB.Net etc.
Können Sie unter dem folgenden link für diesen:
http://www.leadtools.com/downloads/default.htm?category=