Tag: tesseract

Tesseract ist ein OCR – (Optical Character Recognition) Motor ursprünglich entwickelt von HP Labs und jetzt eine open-source-Bibliothek, die mit der Entwicklung von Google gesponsert.

Install tesseract/pytesser auf Mac OS X

Anzahl der Antworten 2 Antworten
Ich versuche diese zu installieren (und zusätzlich pytesser) für osx 10.9 (mit anaconda als Standard-python). Ich habe sah rund um online, aber ich kann nicht mit den tutorials zu arbeiten, wie Sie scheinen alle ausgestorben zu sein

Wo finde ich samples von HOCR-Dateien?

Anzahl der Antworten 2 Antworten
Wo finde ich Beispiele oder Beispiele von Dateien im hocr-format? (Das format, in dem OCR extrahiert text gespeichert ist, mit Seiten-Koordinaten.) Habe ich gesucht auf Google, aber nicht die Art von Proben. Dank! InformationsquelleAutor Alasdair | 2011-11-25

Benutzerwörterbuch für Tesseract

Anzahl der Antworten 1 Antworten
Ich arbeite derzeit an einem Projekt für android-mit tesseract-OCR. Ich hatte gehofft, um die Feinabstimmung der Ergebnisse an die Benutzer, indem ein Wörterbuch. Nach http://code.google.com/p/tesseract-ocr/wiki/FAQ , der beste Weg zu gehen über diese wäre Ersetzen tessdata/eng.Benutzer-Worte mit

Tess4J IllegalStateException: Eingang nicht gesetzt

Anzahl der Antworten 1 Antworten
Also ich habe meinen Eclipse und die notwendigen Bibliotheken zu bekommen Tess4J arbeiten, aber es gibt mir eine Fehlermeldung wenn ich den Beispiel code. Das imagefile ist direkt in der root des Arbeitsbereichs, und ich versuchte sogar,

Tesseract-OCR - Handschriftliche schriftart

Anzahl der Antworten 2 Antworten
Ich versuche, Tesseract-OCR zu erkennen, den text der Bilder mit reinem text, aber dieser text hat einen handgeschriebenen schriftart mit dem Namen Journal. Beispiel: Das Ergebnis ist nicht das beste: Maxima! Größe` W (35) Gibt es irgendeine

iOS Tesseract: schlechte Ergebnisse

Anzahl der Antworten 5 Antworten
Habe ich nur angefangen, um meine Hände schmutzig mit der Tesseract-Bibliothek, aber die Ergebnisse sind wirklich, wirklich schlecht. Folgte ich den Anweisungen in dem Git-repository ( https://github.com/gali8/Tesseract-OCR-iOS ). Meine ViewController verwendet die folgende Methode, um beginnen zu

Tesseract SetVariable tessedit_char_whitelist in einer anderen Sprache

Anzahl der Antworten 1 Antworten
Tesseract setVariable-whitelist funktioniert ok, für englische Sprache, zum Beispiel nutze ich dies, um zu erkennen, nur Ziffern und Buchstaben aus dem Bild ein (ohne Sonderzeichen &*^%! etc) _ocr.SetVariable("tessedit_char_whitelist", "0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ"); Aber ich kann das nicht tun das gleiche

Probleme beim erkennen von Ziffern in Tesseract - android

Anzahl der Antworten 3 Antworten
Ich hatte gehofft, jemand könnte mir sagen, warum, es ist mein Tesseract hat Schwierigkeiten zu erkennen, einige Bilder mit Ziffern, und wenn ich etwas über es tun können. Alles funktioniert laut test, und da ist es nur

Training tesseract für die Verwendung mit iPhone

Anzahl der Antworten 1 Antworten
Ich versuche, mit tesseract-2.04 in meinem iPhone-Anwendung und wollen einfach nur zu erkennen, die zahlen. Was ich hier mache ist erste ich bin cross-Compilierung tesseract zu generieren lib-Datei mit diesem post http://robertcarlsen.net/2009/07/15/cross-compiling-for-iphone-dev-884 und dann mit der demo-Anwendung

Wie tesseract mehrere Dateien im selben Ordner aus der Eingabeaufforderung?

Anzahl der Antworten 4 Antworten
Weiß ich, wie man Tesseract mehrere Dateien in das gleiche Verzeichnis verwenden von Terminal auf OS X. for i in *.tif ; do tesseract $i outtext; done; Hat jemand Vorschläge, wie dies zu tun auf der Eingabeaufforderung

CMake für Tesseract und OpenCV

Anzahl der Antworten 1 Antworten
Ich bin neu in Linux-Programmierung, ich bin versucht, erstellen Sie eine OCR-Anwendung auf Ubuntu 12.10 mit Tesseract und OpenCV. Bisher habe ich die setup - tesseract und OpenCV auf linux auch ich folgten diesem tutorial, in diesem

Kompilieren Tesseract-OCR-auf 64-bit-Windows

Anzahl der Antworten 1 Antworten
Ich versuche zu kompilieren Tesseract OCR in ein Windows-64-bit-version der Bibliothek. Ich habe heruntergeladen die Quelle geholt und es kompilieren zu einem 32-bit-version, die mit Visual Studio Express C++ 2010, aber da bin ich nicht normalerweise ein

tesserakt (.NET) + durchsuchbare PDF-Datei. Wie bewerben Sie sich?

Anzahl der Antworten 1 Antworten
Habe ich das Bedürfnis, ein system zu entwickeln, das verwandelt ein Bild in eine durchsuchbare PDF-Datei. Wie ist eine Schule arbeite, brauche ich etwas mit open source Nach viel Forschung fand ich tessnet2 (tesseract) und ich kann

Verbessern Sie die Genauigkeit Android TessBaseAPI (Tesseract) OCR

Anzahl der Antworten 1 Antworten
Es ist schwer zu sagen, was hier gefragt. Diese Frage ist mehrdeutig, unklar, unvollständig, zu breit, oder der rhetorischen und nicht sinnvoll zu beantworten, die in seiner aktuellen form. Für Hilfe bei der Klärung dieser Frage, so

Tessnet2 mit Tesseract-Engine - Warum gibt es sehr schlechte Ausgabe?

Anzahl der Antworten 1 Antworten
Ich versuche, mit der Tessnet2 mit Tesseract-engine in C#. Für viele der test-Bilder, die ich geben Tessnet2, der Ausgang ist sehr schlecht, und fast nichts ist richtig. Dies ist mein code in C# - Konsole-Projekt-Programm.cs Klasse: static

OCR (tesseract), intelligente rotation Bild

Anzahl der Antworten 2 Antworten
Ich bin die Entwicklung einer Android-app, die verwendet tesseract-OCR-Texterkennung, jetzt habe ich das Problem, dass auf verschiedenen Smartphones wird das Bild wieder drehen, in einer anderen Art und Weise, so dass auf ein es ist im Querformat

Bildvorverarbeitung vor der OCR-Prozess

Anzahl der Antworten 3 Antworten
Mein Aktuelles Projekt umfasst Transkriptionen von Texten in pdf-Dateien in text-Dateien, und ich zuerst versucht, indem Sie die Bild-Datei direkt in das OCR-Programm (tesseract) und es nicht' gut tun. Die original-Bilddateien sind alte Zeitungen, im Grunde, und

Deaktivieren Wörterbuch Tesseract

Anzahl der Antworten 1 Antworten
Wie kann ich das deaktivieren Wörterbuch Korrekturen beim ausführen von Tesseract für die englische Sprache? Ich bin derzeit ausgeführt wird tesseract als Kind-Prozess. InformationsquelleAutor sashoalm | 2013-01-16

Gibt es eine Möglichkeit zur Verbesserung der tesseract OCR mit kleinen Schriften?

Anzahl der Antworten 1 Antworten
Ich versuche, tesseract-OCR via python-tesseract zu Lesen, eine niedrige Auflösung, schriftart, die so aussieht: Leider das Bild kehrt zurück, ZIJZHZI Ich denke, die Auflösung ist zu gering und verursacht Probleme. Ich habe versucht, vergrößern Sie das Bild

Wie man die Koordinaten der erkannten Zeichen

Anzahl der Antworten 2 Antworten
Habe ich eine sehr einfache OCR-app basiert auf Tesseract. Nach der Anerkennung Schritt, ich habe auch einen Benutzer-Verifizierungs-Schritt, der es ermöglicht, die Korrektur bei OCR ist falsch. Die Verbesserung der Benutzeroberfläche, die ich Plane zu zeichnen Rechteck

Zeichenerkennung mit tesseract

Anzahl der Antworten 4 Antworten
Ich versuche, die Interaktion mit tesseract API auch ich bin neu in der Bildbearbeitung und ich bin nur mit ihm zu kämpfen für die letzten paar Tage. Ich habe versucht, einfache algorithmen und ich erreicht haben, rund

Kann `tesseract-ocr` das Ergebnis auf STDOUT aus?

Anzahl der Antworten 2 Antworten
Mit tesseract-ocr #3.02.02. Die grundsätzliche Verwendung von tesseract ist tesseract sourc.png result sowie result.txt generiert wird. Um das Ergebnis, den text, ich muss die Katze diese Datei. Gibt es irgendwelche Möglichkeiten, dump und das Ergebnis in die

training tesseract für handgeschriebenen text

Anzahl der Antworten 1 Antworten
Brauche ich, um zu identifizieren, handgeschriebenen text (icr). Keine Notwendigkeit zu verstehen, die beliebige text - ich bin in der Lage, anweisen, meine Nutzer zu schreiben sehr deutlich, mit separaten Buchstaben und etc. Aber noch gibt es

java tesseract Fehler in linux “Unable to load library 'tesseract': libtesseract.so"

Anzahl der Antworten 6 Antworten
Ich bin mit tess4J ocr-Bibliothek in eclipse implementieren und funktioniert gut in meinem windows. Aber wenn ich laufen will, dass java-Programm in linux-es gibt eine Fehlermeldung "Unable to load library 'tesseract': libtesseract.also: nicht öffnen können shared object-Datei:

configure: error: leptonica Bibliothek fehlt (beim Bau tesseract-ocr-3.01 MinGW)

Anzahl der Antworten 10 Antworten
Beim ausführen konfigurieren, schlägt er mit checking for leptonica... yes checking for pixCreate in -llept... no configure: error: leptonica library missing Aber ich habe leptonica 1.69 gebaut (Quelle heruntergeladen und lief ./configure && make install) Bearbeiten Ich

Die Installation von Tesseract-OCR auf CentOS 6

Anzahl der Antworten 6 Antworten
Ich versuche zu install Tesseract-OCR auf meinem server aber wenn ich installieren alles, was ich glaube, um die richtigen repos. Wenn ich versuche, es zu installieren Sie das Paket nicht gefunden Habe ich versucht, indem rpmforge aber

Convert InputStream zur Datei

Anzahl der Antworten 2 Antworten
Habe ich einen REST-webservice gebaut mit Jersey das bedeutet OCR (Optical Character Recognition) verwenden von Tesseract über die Tess4J Java-Bindung. Jetzt die Tess4J Bibliothek erwartet, dass Sie senden Sie ein Bild-Datei (png, jpg, tif u.a.), aber mit

Python-OCR : Konvertieren Sie Gescannte Bild In Text Zur Bearbeitung

Anzahl der Antworten 1 Antworten
Ich versuche zum erstellen einer Antwort-Papier markieren (multiple-choice-Frage) python-Anwendung. Die Antwort Blatt wird gescannt, in Bild-Datei (gif,png,jpg,je nachdem, welches format benötigt wird). Meine App hat Zugriff auf die Datenbank, in der alle Antworten gespeichert sind. Also,alles, was

Tess4j nicht verwenden, es ist tessdata Ordner

Anzahl der Antworten 4 Antworten
Ich bin mit tess4j, den java-wrapper für Tesseract. Ich habe auch die normalen Tesseract installiert. Ich bin mir nicht ganz sicher, wie tess4j gemeint ist, zu arbeiten, aber da kommt es mit einem tessdata Ordner, kann ich

Tesseract - Sprache ändern Speicherort der Datei

Anzahl der Antworten 3 Antworten
Mache ich ein AIR-Projekt, die brauchen einige OCR-Fähigkeiten, so dass ich mich entschieden habe, tesseract (jetzt versuche ich, um es arbeiten auf Windows). Mein problem ist, das kann nicht ändern Sie den Speicherort der Sprachdatei - es

Darunter Tess4J, um ein Java-Projekt als library in Eclipse

Anzahl der Antworten 2 Antworten
Habe ich einen bisher leeren und reinigen der Eclipse-Java-Projekt. Was muss ich tun, um zu verwenden Tess4J als Bibliothek für meine web-service, die ich entwickeln will? Ist es sogar möglich, verwenden Sie es als Bibliothek für ein

Wie bewahren Sie die Struktur Ihrer Dokumente in tesseract

Anzahl der Antworten 4 Antworten
Ich bin mit tesseract-ocr zu extrahieren von text aus einem Bild. Erhalten Sie die Struktur des Dokuments ist sehr wichtig für mich. Derzeit tesseract nicht die Erhaltung der Struktur, es ändert sich die Reihenfolge von text. Mein

Konvertieren Sie gescannte pdf zu .txt-Dateien mit tesseract

Anzahl der Antworten 1 Antworten
Habe ich zu konvertieren ein .pdf - Datei enthält gescannte Bilder in .txt - Dateien. Die tesseract ocr wandelt nur Bilder zu .txt, aber ich müssen Sie zuerst extrahieren Sie die .tif Bilder und dann konvertieren. Kann

Schwelle Bild mit opencv (Java)

Anzahl der Antworten 1 Antworten
Arbeite ich mit Opencv für mein Projekt. Ich brauche, um zu konvertieren das Bild unten, um die Schwelle Bild Habe ich versucht, diese Funktion: Imgproc.threshold(imgGray, imgThreshold, 0, 255, Imgproc.THRESH_BINARY + Imgproc.THRESH_OTSU); Aber das Ergebnis war nicht so

Seite-layout-Analyse mit Hilfe von Tesseract?

Anzahl der Antworten 4 Antworten
Tesseract 3 durchführen Seite-layout-Analyse. Allerdings konnte ich keinen Beispielcode oder eine Dokumentation, wie die Bibliothek zu benutzen für solche Zwecke. Ich hoffe das hier jemand erklären kann, wie Sie führen layout-Analyse in einem Bild auf, wie zu

Tesseract: Angabe der Regionen text

Anzahl der Antworten 2 Antworten
Ich bin mit tesseract-ocr-3.01 Scannen viele Formen. Die Formen Folgen alle einem template, also ich weiß schon, wo die Regionen/Rechtecke mit text sind. Gibt es eine Möglichkeit zu geben diese Regionen zu tesseract bei der Verwendung des

Ist die Anzahl Anerkennung auf dem iPhone möglich, in real-Zeit?

Anzahl der Antworten 5 Antworten
Ich brauche das erkennen von zahlen aus dem Bild der Kamera auf dem iPhone in Echtzeit. Ich weiß, es wird nicht mehr als 5 stellen auf dem Bild. Ist dieses problem realistisch lösen gegeben, die rechnerische Spezifikationen

Open-CV - Nicht korrekt geladen wird

Anzahl der Antworten 2 Antworten
Ich bin mit Ubuntu 14.04 und ich versuche, um diesen code zu kompilieren, aber ich bekomme diese Fehler, egal was, ich glaube, es hat etwas zu tun mit der Einbeziehung der OpenCV-Bibliothek, aber ich bin mir nicht

Tesseract Beispiel für Iphone

Anzahl der Antworten 2 Antworten
Habe ich zusammengestellt tesseract für die Verwendung in xcode folgenden: http://iphone.olipion.com/cross-compilation/tesseract-ocr Ich erhalten .eine Datei, importieren Sie es als Rahmen des iphone-Projekts, und aktualisieren Sie die header-Suchpfad für tesseract-header-Dateien. So, jetzt brauche ich ein einfaches Beispiel, um

Python-Fehler beim importieren image_to_string von tesseract

Anzahl der Antworten 4 Antworten
Ich habe vor kurzem verwendet tesseract OCR mit python und ich habe immer ein Fehler wenn ich versuche zu importieren image_to_string von tesseract. Code verursacht das problem: # Perform OCR using tesseract-ocr library from tesseract import image_to_string

Tesseract.NET in C#

Anzahl der Antworten 3 Antworten
Weißt du, der Schritt für Schritt Anleitung, wie Sie mit Mülltonnen und dlls in http://www.pixel-technology.com/freeware/tessnet2/ Verbrachte ich 2 Tage lang versucht Sie zu verwenden, indem beim kompilieren bin ich gebeten für eine dll, die nicht in der

Zu erkennen, wie-Text-Bereich aus Bild?

Anzahl der Antworten 3 Antworten
will ich erkennen text-Bereich vom Bild als einem preprocessing-Schritt für tesseract OCR engine, der Motor funktioniert gut, wenn der input nur text ist, aber wenn das Eingabebild enthält Nichttext-Inhalte, auf die es fällt, so möchte ich erkennen,

Tesseract Nicht Gefunden " - Fehler

Anzahl der Antworten 20 Antworten
Ich versuche, mit pytesseract in python, aber am Ende immer mit der Fehlermeldung: "TesseractNotFoundError: tesseract ist nicht installiert oder es ist nicht in Ihrem Pfad" pytesseract und tesseract sind installiert im system. Ich bin neu in python,

Tesseract-training für eine neue schriftart

Anzahl der Antworten 3 Antworten
Ich bin noch neu auf Tesseract-OCR und nachdem er es in mein script es bemerkt hatte, eine relativ große Fehlerquote für die Bilder, die ich versuchte, zu extrahieren text aus. Ich kam über Tesseract Ausbildung, die angeblich

Tesseract-OCR-text, um Dokumente mit Tabellen oder Zeilen

Anzahl der Antworten 2 Antworten
Ich bin mit Tesseract-OCR zu konvertieren Sie gescannte PDF-Dateien in text. Insgesamt ist es sehr effektiv, aber ich habe Probleme mit der Bestellung, dass der text gescannt wird. Unterlagen mit tabellarischen Daten scheinen zu Scannen unten, Spalte

Installation pytesser

Anzahl der Antworten 7 Antworten
Ich bin neu in python und möchte zu installieren und zu verwenden, die pytesser OCR-Bibliothek. Alle anderen Module, die ich installiert habe, habe ich easy_install verwendet, das hat alles geklappt. Aber pytesser ist die erste, die ich

Pytesseract : "TesseractNotFound Fehler: tesseract ist nicht installiert oder es ist nicht in Ihrem Pfad", wie behebe ich dieses Problem?

Anzahl der Antworten 9 Antworten
Ich versuche, führen Sie eine grundlegende und sehr einfache code in python. from PIL import Image import pytesseract im = Image.open("sample1.jpg") text = pytesseract.image_to_string(im, lang = 'eng') print(text) Dies ist, wie es aussieht, habe ich eigentlich installiert

Kein Modul namens tesseract

Anzahl der Antworten 2 Antworten
Arbeiten auf einer OCR. Ich kann importieren pytesseract und verwenden image_to_string aber ich möchte mit dieser Arbeit: api = tesseract.TessBaseAPI() api.SetVariable("tessedit_char_whitelist", "0123456789") api.Init('.','eng',tesseract.OEM_DEFAULT) api.SetPageSegMode(tesseract.PSM_AUTO) Ist tesseract zu erkennen, nur aus zahlen oder Alphabete. Wenn ich meinem code

Automatische KFZ-Kennzeichenerkennung

Anzahl der Antworten 2 Antworten
Wie der Titel vorschlagen, das ich bauen will ein ANPR-Anwendung in windows. Ich bin mit brasilianischen Nummernschildern. Und ich bin mit OpenCV für diese. So weit ich manged zu extrahieren, die die Buchstaben bilden das Nummernschild. Folgende

Wie kann ich trainieren Tesseract unter Windows

Anzahl der Antworten 2 Antworten
Ich versuche zu trainieren tesseract für die Arbeit unter windows. Der Prozess gut abschließen, aber wenn ich den Aufruf zu tesseract.exe file.tiff out nach diesem Lauf, die Datei ist leer. Ich weiß nicht, was hier passiert ist,