TensorFlow - Texterkennung in Bild
Ich bin neu TensorFlow und Tiefen Lernen.
Ich versuche zu erkennen, text in naturel-Szene Bilder. Ich verwendet, um arbeiten mit einer OCR-aber ich würde gern von Deep Learning. Der text hat immer das gleiche format :
ABC-DEF 88:88
.
Was ich gemacht habe, ist erkennen, jedes Zeichen/Ziffer. Es bedeutet, dass ich beschnitten das Bild um jeden Charakter (also jedes Bild gibt mir 10 Zeichen) zu bauen meine Trainings-und Testsatz und bauen Sie sich ein zwei conv neuronale Netze. Also meine Ausbildung war eine Reihe von Zeichen, die Bilder und die Beschriftungen waren nur Zeichen/Ziffern.
Aber ich möchte noch weiter gehen. Was ich tun möchte, ist nur zu geben, die voller Bilder und die Ausgabe der gesamte text (nicht zu einem Charakter wie in meinem vorherigen Modell).
Vielen Dank im Voraus für jede Hilfe.
Du musst angemeldet sein, um einen Kommentar abzugeben.
Die Schwierigkeit ist, dass Sie nicht wissen, wo der text ist. Die Lösung ist, ein Bild, das Sie benötigen, um ein gleitendes Fenster zuschneiden anderen Teil des Bildes, dann mit einem Klassifizierer, um zu entscheiden, ob es Texte gibt, in den zugeschnittenen Bereich. Wenn so, verwenden Sie Ihre Zeichen/Ziffer-Erkennung zu erkennen, welche Buchstaben/Ziffern Sie wirklich sind.
Also müssen Sie trainieren eine andere classifer: gegeben ein zugeschnittenes Bild (Größe der Bilder sollte etwas größer als die Ihrer text-Bereich), zu entscheiden, ob es Texte gibt, innen.
Nur Konstrukt Trainings-set (positive Proben sind auch Texte, die negativen Beispiele sind in anderen Bereichen nach dem Zufallsprinzip abgeschnitten von der großen Bilder) und Zug~