Ist die Anzahl Anerkennung auf dem iPhone möglich, in real-Zeit?
Ich brauche das erkennen von zahlen aus dem Bild der Kamera auf dem iPhone in Echtzeit. Ich weiß, es wird nicht mehr als 5 stellen auf dem Bild.
Ist dieses problem realistisch lösen gegeben, die rechnerische Spezifikationen des iPhone?
Hat jemand irgendwelche Erfahrungen mit der Verwendung der Tesseract OCR-Bibliothek, und glaubst du, es könnte gelöst werden, indem es zu benutzen?
- mögliche Duplikate von: stackoverflow.com/questions/3140455/...
- Während diese Frage fragt, wie es zu verwenden Tesseract zahlen zu Lesen in jedem Einzelbild, das ist die Untersuchung die Möglichkeit, das zu tun diese Art der Verarbeitung von live-video-stream. Ich glaube, es gibt genug Unterschied zu rechtfertigen, eine neue Frage.
Du musst angemeldet sein, um einen Kommentar abzugeben.
Das hängt von Ihrer definition von "Echtzeit", aber es sollte ja auch möglich sein, das zu tun relativ schnell die Anerkennung der nur die Ziffern 0-9 auf ein iPhone 4, vor allem, wenn Sie können Schriftarten, Lichtverhältnisse, etc. dass Sie erscheinen wird.
Empfehle ich das Lesen der Artikel auf wie Sudoku Grab hat seine Anerkennung Rätsel mit der iPhone-Kamera. In Ihrem Fall, einen trainierten neuronalen Netzes verwendet wurde zu identifizieren, die Ziffern, das sollte ziemlich einfach und schnell auf modernen iOS-hardware.
Die aktuelle Anerkennung Bibliotheken gibt, wie OpenCV verwenden, werden die iPhone ' s der CPU zu tun, die Verarbeitung. Ich habe gehört, dass Sie tun können, auch komplexere Aufgaben, wie die Gesichts-Erkennung schnell genug, um video-Quellen und zeigt eine minimale Menge von Stottern.
Für eine noch bessere performance, ich glaube, es gibt eine Menge Potenzial in der programmierbaren GPUs der neueren iOS-Geräte. In meine benchmarks, sah ich einen 14X - 28X speedup bei der Verwendung des iPhone 4 ist die GPU für die einfache Bildverarbeitung. Während einige Menschen sind auf der Suche auf dieses Recht jetzt, so etwas wie Sudoku Schnappen Sie sich das neuronale Netzwerk eine parallele genug, Prozess profitieren, laufen auf der GPU.
Sollte es rechnerisch möglich ist. Es gibt apps, die kann man eine bar-code in Echtzeit, und auch eine app, die Echtzeit-übersetzung. (Word Lens). Ich bin mir nicht sicher, welche Bibliotheken Sie verwenden, jedoch.
JA, es ist möglich mit der tesseract-engine
Hier ist der Beispiel-code, wenn Sie prüfen möchten,...
https://github.com/nolanbrown/Tesseract-iPhone-Demo
Gibt es kostenloses SDK für die: http://rtrsdk.com/ Unterstützt sowohl iOS und Android, arbeitet in Echtzeit, hilft Ihnen erfassen Sie einen beliebigen text, zahlen, sollte das kein problem sein.
Disclaimer: ich arbeite für ABBYY
Ja. Bender kann Ihnen dabei helfen. Es ermöglicht Ihnen das erstellen und ausführen von neuronalen Netzen auf iOS. Als es nutzt Metall unter der Haube, es läuft schnell und glatt. Es unterstützt auch das ausführen von TensorFlow Modelle direkt.
So dass Sie ausführen können, in Bender ein bestehendes Modell in TensorFlow trainiert für Ziffer Anerkennung Handschriftliche Digit Recognition using Convolutional Neural Networks in Python mit Keras, wenn Sie Hilfe benötigen
Disclaimer: ich arbeitete an diesem Projekt.