Lesen von Zeichen aus einem Bild

Arbeite ich an einer Anwendung, die erfordert Abgleich von zahlen aus einem gescannten image-Datei auf Datenbank-Eintrag und aktualisieren Sie die Datenbank mit dem gleichen Ergebnis.

Sagen, ich habe Bild - employee1.jpg. Dieses Bild soll zwei zwei handschriftliche Einträge - Mitarbeiter-Anzahl und den Betrag an den Mitarbeiter ausgezahlt werden. Ich Lesen Sie die Mitarbeiter-Zahl aus dem Bild und Abfragen der Datenbank, für die diese Zahl haben, aktualisieren die Mitarbeiter mit den zu zahlenden Betrag, wie von der Bild. Sowohl die Mitarbeiter-Anzahl und den zu zahlenden Betrag sind geschrieben und in zwei Boxen an einem bestimmten Ort auf dem Bild.

Gibt es eine Möglichkeit, dies zu automatisieren. Im Grunde möchte ich eine Lösung .net mit c#. Ich weiß, das getan werden kann mithilfe von künstlichen neuronalen Netzwerken.

Irgendwelche Ideen würde sehr geschätzt.

InformationsquelleAutor Chinjoo | 2010-06-10

.net c#image-manipulation image-processing

3

Können Sie mithilfe von Microsoft Office Document Imaging Library (MODI), die sich in der Office 2003/2007.

Links:
- OCR mit Microsoft® Office - Code
  Projekt - Beispiel für die Verwendung von MODI
- Microsoft Office Document Imaging" -
  Wikipedia - enthält ein einfaches
  Beispiel in VB.NET
InformationsquelleAutor bniwredyc
1

Mustererkennung ist ein basic Beispiel, wenn neuronale Netzwerke untersucht. Ich weiß nicht, ob irgendeine Bibliothek/framework für die Arbeit mit AI in C#. Wenn Sie finden, eine, erste Sie tun müssen, ist die Bahn das Netz (überwachtes lernen) und für diese müssen Sie bereiten eine große Stichprobe von Bildern; weitere Beispiele -> Ergebnis genauer. In der anderen hand können Sie verwenden OpenCV (C/C++, Python und Java), die eine spezialisierte Bibliothek in der computer vision und hat ein Modul zur Implementierung der KI-Methoden.

Haben einen schönen Tag!
Oscar.

InformationsquelleAutor osanchezmon
1

Ich denke, das ist sehr schwer zu automatisieren. Das problem ist nur, da müssen Sie irgendeine Art von sehr gute OCR-software. Und selbst wenn man das, was ist, wenn er liest etwas falsch, Ursache des frouzy Handschrift von jemand? Wenn die ID falsch ist, die bezahlt ist gebucht, um die falschen Mitarbeiter, und wenn der Betrag falsch ist, er habe die falsche Gehalt!

Sind beide Dinge, die Sie nicht wirklich passieren. Nur um Ihnen zu zeigen, wie schwer eine gute ocr zu finden ist, nehmen Sie nur einen Blick auf, wie ein captcha funktioniert. Das Prinzip ist nichts weiter als ein Bild von einem schwer, den text zu Lesen.

Also meine Meinung wäre, dass Sie nicht wirklich diesen Prozess automatisieren. Zumindest kann man ein Programm schreiben, um bei einem Menschen durch die Eingabe der Werte manuell (werfen Sie auch einen Blick auf Amazon Mechanical Turk):
- Karte auf der rechten Seite das Bild mit den handschriftlichen Werten, oder, wenn Sie sind immer auf der gleichen position oder speziell gekennzeichnet (mit einem Kasten um Sie herum, etc.), versuchen Sie finden diesen Orten automatisch und zeigt Sie an den Benutzer.
- Auf der linken Seite bieten zwei Textfelder, in denen der Benutzer kann die Werte eingeben.
Dieses zu erhalten, um einen schnellen und reibungslosen Ablauf, müssen Sie sehr darauf achten über wie kann der Benutzer geben Sie einfach die Werte, die nur mit der Tastatur:
- Bei der Anzeige eines neuen Bildes, legen Sie den Fokus auf die id der textbox
- Wenn die Benutzer-id ist immer eine bestimmte Länge, wechseln Sie zum nächsten Feld, wenn alle zahlen eingegeben sind
  - (Wenn Sie dies zulassen, ein Rückschritt in der nächsten leeren Feld sollte der Fokus wieder auf das Vorherige)
- Sonst ermöglichen den übergang auf die nächste textbox durch drücken von tab oder zurück
- Der Regel diese Textfelder angeordnet sind, übereinander (nicht nebeneinander), so sollten Sie unterstützen das Umschalten zwischen Ihnen mit den up-down-Pfeil-Tasten.
- Nach Beendigung der Eintragung in das Letzte Textfeld zeigt automatisch das nächste Bild.
  - Auch in diesem Fall von einem frischen, neuen Eintrag (nichts ist bereits eingegeben) ermöglichen einen einfachen Wechsel zurück zu den alten Eintrag mit der Rücktaste oder Pfeil Links-Taste)
Durch die Verwendung solcher Prozess kann auch nur eine person geben viele Einträge in der Datenbank und die Kosten sind viel billiger als die Suche nach falschen Einträgen in der Datenbank danach.

Nur ein letzter Vorschlag:

Ursache dafür ist eine langweilige Prozess für Menschen, die leicht zu einem Fehler führt, vielleicht lassen zwei Menschen, die diese Werte eingeben, und nur wenn beide in die gleiche, als nehmen Sie diesen Wert als genehmigt. Dies sollte dazu führen, einen richtigen Kurs irgendwo über 99%. Wenn Sie müssen absolut 100% denken über Vermietung 4-5 Personen überprüfung, ein Eintrag-und nur, wenn alle von Ihnen geben Sie die gleichen Werte nehmen es als genehmigt. Um auch einen Vergleich darüber, wie gut Ihre ocr-software wäre, lass es einfach laufen auch über Ihre Bilder und vergleichen diese Ergebnisse auf den menschlichen eingegebenen Werte, um eine Vorstellung zu bekommen, wenn Sie können wirklich verlassen sich auf Ihre ocr nur.
- +1 darauf hin, dass das OCR ist nicht so zuverlässig. Ich würde ein weiteres +1 für die Idee des mechanical turk 😉
InformationsquelleAutor Oliver
1

OCR-engines sind nicht ausgebildet, um zu Lesen handgeschriebener text, so dass Sie möglicherweise Schwierigkeiten haben, mit MODI. Sie wollen versuchen zu finden eine ICR-engine. Auch so, die besten von Ihnen sind nur 80% genau auf gute inputs. Sie könnten besser, weil Sie wissen, dass Sie Ihren text immer zahlen.

Diesem ALSO Frage/Antwort sagt, dass OCROpus hat ICR

FOSS Intelligent Character Recognition (ICR)

InformationsquelleAutor Lou Franco
1

Gibt es SDK-LeadTools OCR/ICR. Dies ist sehr nützlich bei der Erkennung der handschriftlichen Zeichen. Ich bin dabei eine feasibilty-Studie mit dieser, und bis jetzt denke ich klappt es. leadTools zur Verfügung gestellt haben Komponenten, die in Ihrer Anwendung verwendet werden, es unterstützt C, C++, C#, VB.Net etc.

Können Sie unter dem folgenden link für diesen:
http://www.leadtools.com/downloads/default.htm?category=

InformationsquelleAutor Chinjoo

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.