python-captcha decoder-Bibliothek
Brauche ich eine Captcha-decoder für python zum Lesen einfach Bild captchas wie das folgende Bild:
Kennen Sie eine Bibliothek, die mir helfen kann dieses captcha Lesen?
Wenn Sie nicht wissen, einer Bibliothek zum Lesen von captchas, könnten Sie mir helfen um diesen zu Lesen (und andere wie diese) mit PIL?
Ich denke, dass sollte man nicht tun will
InformationsquelleAutor 2 8 | 2012-12-01
Du musst angemeldet sein, um einen Kommentar abzugeben.
Ich hoffe, das captcha wird nicht überall verwendet.
Folgenden ist ein dummy Weg, Sie zu entschlüsseln. Im Grunde, was Sie brauchen, sind die Muster von 0 bis 9, die in diese captchas. Von deinen Beispielen habe ich nur die Muster für die 0 3 4 5 7 8. Da alles ist fixiert auf Sie, Sie wissen, wo Sie aufgeteilt jeden Charakter. Sie wissen auch, jedes Zeichen ist eine Zahl mit fester Größe und fester Schrift. Wenn es enthält auch Buchstaben oder Zeichen mehr, sondern Feste Größe und schriftart, dann wird der folgende code kann leicht angepasst werden.
Was der code tut, ist: a) laden Sie die Muster (ich hielt Sie die Bezeichnung n0.png, n1.png, ...); b) teilen Sie die captcha in NUMS Stück; c) die Summe der quadrierten Differenzen zwischen jedem Muster und jeder split Anzahl; d) entscheiden, daß der split-Anzahl ist derjenige mit der kleinsten Summe. Es gibt eine Liste für jede Nummer, in der Reihenfolge, die in der captcha. Erhalten Sie das erste Muster, Sie können die Auskommentierung der Zeilen, speichern Sie die split-zahlen, platzieren Sie ein
return
nach diesem Stück, und passen Sie die Datei-Namen.dies scheint ein wirklich,wirklich grundlegende OCR mit einer schriftart. Warum nicht einfach Tesseract? Es ist viel komplexer. Ich finde es auch nützlich, um cluster auf bestimmte Merkmale zu Zeiten, aber, wieder, Tesseract macht all dies und weit mehr nützlich.
InformationsquelleAutor mmgp
Es ist ein schönes Projekt zu tun für Akademische Gründe, ich war daran interessiert, dies vor einer Weile. Sie haben ein paar Optionen:
Schreiben Sie Ihre eigenen mit Hilfe von dieser Seite: http://www.wausita.com/captcha/
Sie verwenden OpenCV, um zu tun die passenden.
Wenn denke, es war eine dedizierte Bibliothek für neuronale Netzwerk-image matching, aber ich kann nicht scheinen, um es zu finden.
Im Grunde wie die anderen gesagt haben, wollen Sie das Rauschen entfernen, aufgeteilt in einzelne chars und vergleichen Sie es mit einer ausgewählten Technik, um das Modell chars.
InformationsquelleAutor Bartlomiej Lewandowski
Ich hoffe, dass Sie es sind, in gutem glauben und gehen Sie nicht zu Schaden (/spam) jeder.
Ich werde Sie nicht schreiben Sie das Skript noch an Sie weiterleiten, um ein externes plugin. Aber falls du das schreiben dieser durch Ihre eigenen sind, dies kann helfen:
InformationsquelleAutor hrr