Vorhandene OCR-Skripte in JavaScript

Ich habe eine Idee für eine CMS-Erweiterung, um text zu extrahieren von Informationen aus Bildern (Z. B. gescannte Dokumente) und möchte wissen, ob es schon etwas gibt, mir zu helfen entlang?

Im Grunde möchte ich wissen, ob es eine bestehende OCR-Skript in JavaScript geschrieben, der zu extrahieren, können Sätze/Wörter aus einem Bild (mit canvas zum Beispiel).

Ich weiß, es gibt einige Skripte, die relativ kleine Aufgaben wie das captcha-knacken, aber ich habe mich noch nicht auf ein Skript für die Extraktion von ganzen Sätzen.

Ist es so eine Sache, oder hätte ich schreiben müssen, das es von Grund auf neu?

  • Ich wirklich Zweifel, Sie werden in der Lage sein, dies zu tun. OCR ist nicht etwas, was Sie können code über Nacht. Es ist ein immens schwieriges Konzept, um code für nicht-triviale Fälle (wie bestimmte CAPTCHAs). JavaScript ist nicht die beste Sprache für diese entweder...
  • warum tut es in Javascript ?
  • Ich möchte es in JavaScript, denn ich will nicht zu verhängen, die keine zusätzliche Belastung für den server. Der aktuelle Grund, warum ich dies mache ist, dass ich ein Buch Zeugnisse geschrieben, dass ich Scannen und hinzufügen einer website, und ich möchte in der Lage sein, den text in Suchmaschinen-lesbar Mode als auch. Natürlich, ich /könnte/ es laufen alle durch ein OCR-Paket vor der hand, aber ich bin auch das denken an zukünftige Projekte, bei denen ich wollen kann, nur führen Sie OCR für ein Bild, von welchem computer ich arbeite aus, ob es eine OCR-software installiert ist oder nicht.
  • Ja, OCR ist schwierig, und es wäre nicht eine über-Nacht-job, und das ist, warum ich Frage, wenn es bereits getan wurde. Wie für die JavaScript nicht die richtige Sprache... warum? Gibt es etwas, was fehlt JavaScript, das macht irgendwie nicht in der Lage, dies zu tun?
  • Ich würde vorschlagen, Sie nehmen einen Blick auf ejohn.org/blog/ocr-and-neural-nets-in-javascript
  • Das link @James geschrieben ist wahrscheinlich die einzige Sache reden, über OCR in JS, die Sie im web finden werden. Dass gesagt wird, Sie könnten der erste sein, der etwas umsetzen wie die. Sie können sich wahrscheinlich finden Sie eine Menge von Allgemeinen OCR-Papiere und von dort aus arbeiten. JavaScript ist jetzt (und immer mehr) stark genug, um diese Art von Sachen. Das sollten wir ausnutzen.
  • danke @Xeon06 - ich habe diesen Eindruck. Ich hatte schon gelesen Resig ' s post Monate her, und hoffte, dass es war Arbeit, die bereits auf diese. Ich denke, es ist an der Zeit, mit der Planung!

InformationsquelleAutor Kae Verens | 2011-11-28
Schreibe einen Kommentar