Tesseract Nicht Gefunden " - Fehler
Ich versuche, mit pytesseract in python, aber am Ende immer mit der Fehlermeldung:
"TesseractNotFoundError: tesseract ist nicht installiert oder es ist nicht in Ihrem Pfad"
pytesseract und tesseract sind installiert im system. Ich bin neu in python, so dass ich wirklich schätzen, wenn jemand mir helfen kann, mit dieser
- Mein Abschnitt von code, erstellen die Fehlermeldung:" import cv2 import pytesseract img = cv2.imread('C:/Users/user/Desktop/1d.png') print(pytesseract.image_to_string(img))" und der Fehler ist "raise TesseractNotFoundError() TesseractNotFoundError: tesseract ist nicht installiert oder es ist nicht in Ihrem Pfad." Ich habe pytesseract, das im system installiert
- Diese video mein Problem gelöst.
Du musst angemeldet sein, um einen Kommentar abzugeben.
Ich habe versucht, das hinzufügen, um die path-variable wie andere erwähnt haben, aber immer noch erhalten die gleiche Fehlermeldung. was geklappt hat war das hinzufügen dieser zu meinem Skript:
https://github.com/UB-Mannheim/tesseract/wiki
erste und fügen Sie dann die Zeile in dieser Antwort unterimport pytesseract
. Ich denke, man kann installieren pytesseract mit pipBekam ich diese Fehlermeldung, weil ich installiert
pytesseract
mitpip
aber vergessen, es zu installieren mitapt
.Unter ubuntu:
Auf Dem Mac:
Sind Sie wahrscheinlich fehlt
tesseract-ocr
von Ihrem Computer. Überprüfen Sie die installation-Anleitung hier: https://github.com/tesseract-ocr/tesseract/wikiAuf einem Mac können Sie einfach installieren mit homebrew:
brew install tesseract
Sollte es gut laufen danach
Ich bin auf einem Mac OS installiert und tesseract mit brew ist so hier mein nehmen auf diese. Da pytesseract ist nur, wie können Sie Zugang tesseract von python, müssen Sie angeben, wo tesseract ist bereits auf Ihrem computer.
Für Mac OS
Versuchen, herauszufinden, wo die tesseract.exe ist - wenn du es installiert hast mit
brauen, auf Ihrem terminal verwenden:
Dies sollte Liste, wo Ihre tesseract.exe ist irgendwo mehr oder weniger wie
Dann nach Ihren Anweisungen:
sollte den trick tun!
Eine einfache Sache, die eigentlich für mich gearbeitet in Jupyter Notebook, war mit doppelten backslash anstatt einen einzelnen backslash in der pytesseract.pytesseract.tesseract_cmd Pfad:
Unter Windows 10 Betriebssystem-Umgebung, die folgende Methode funktioniert für mich:
https://github.com/tesseract-ocr/tesseract/wiki
Download tesseract und installieren Sie es. Windows-version ist hier erhältlich:
https://github.com/UB-Mannheim/tesseract/wiki
Finden Skript-Datei pytesseract.py aus C:\Users\User\Anaconda3\Lib\site-packages\pytesseract und öffnen Sie es.
Ändern Sie den folgenden code aus
tesseract_cmd = 'tesseract'
zu:tesseract_cmd = 'D:/Program Files (x86)/Tesseract-OCR/tesseract.exe'
Möglicherweise müssen Sie auch die Umgebungsvariable hinzufügen
D:/Program Files (x86)/Tesseract-OCR/
Hoffe, es funktioniert für Sie!
Ich vor dem gleichen problem. Ich hoffe, dass Sie installiert haben, aus hier und haben das auch getan
pip install pytesseract
.Wenn alles in Ordnung ist, sollten Sie sehen, dass der Pfad
C:\Program Files (x86)\Tesseract-OCR where tesseract.exe
verfügbar ist.Hinzufügen Path-variable nicht hat mir geholfen, dass ich tatsächlich neue variable mit dem Namen
tesseract
im environment-Variablen mit einem Wert vonC:\Program Files (x86)\Tesseract-OCR\tesseract.exe
.Eingabe
tesseract
in die Befehlszeile sollte nun wie erwartet funktionieren, indem Sie die Nutzung Informationen. Sie können jetztpytesseract
als solche (vergessen Sie nicht, starten Sie Ihre python-kernel, bevor Sie dies ausführen!):genießen!
Können Sie herunterladen tesseract-ocr-setup über den folgenden link,
Tesseract für windows
Fügen Sie dann neue variable mit dem Namen tesseract in environment-Variablen mit dem Wert C:\Program Files (x86)\Tesseract-OCR\tesseract.exe
Ich Gesicht das gleiche Problem. Ich habe gerade diesen Befehl, der mir helfen wird.
Beachten Sie, dass dies nur funktioniert unter Ubuntu.
sudo
ist ein Unix-exclusive-Befehl (Linux, Mac, Rasbian, etc.) währendapt
ist Ubuntu-spezifisch.Install tesseract aus https://github.com/UB-Mannheim/tesseract/wiki und fügen Sie den Pfad tesseract.exe der Pfad Umgebungsvariable.
Für Mac:
Diese sollte funktionieren.
Stieß ich heute dieses problem und alle Antworten, die hier erwähnt hat mir geholfen, aber ich persönlich hatte zu Graben, eine Menge, um es zu lösen. Lassen Sie mich also allen anderen helfen, indem Sie die Lösung, um es in einer sehr einfachen form:
Laden Sie sich die ausführbare 64-bit (32-bit, wenn Ihr computer ist 32
bit) exe aus hier.
(Name der Datei wäre tesseract-ocr-w64-setup-v5.0.0.20190526
(alpha))
Installieren Sie es. Lassen Sie es installiert sich in der Standard-C-Verzeichnis.
Nun gehen Sie zu Ihrer Umgebungsvariable (Erreichen es nur durch die Suche im start-Menü oder Gehen Sie zu
Control Panel > System > Advanced System Settings > Environment Variables
)a) Wählen Sie PFAD und dann Bearbeiten. Klicken Sie auf NEU und fügen Sie den Pfad wo es installiert ist (in der Regel
C:\Program Files\Tesseract-OCR\
)Nun, Sie werden nicht die Fehler!
Sind, die Sie importieren
Importieren Sie nicht aus pytesseract
War ich auch vor dem gleichen Problem, fügen Sie einfach
C:\Program Files (x86)\Tesseract-OCR
zu Ihrer path-variable.Wenn es dann immer noch nicht funktioniert, fügen Sie
C:\Program Files (x86)\Tesseract-OCR\tessdata
zu Ihrer path-variable in eine neue Zeile. Und vergessen Sie nicht, Ihren computer neu starten, nachdem Sie die path-variable.Ich bin derzeit mit Windows und für die Entwicklung eine PDF-parser und fügen Sie eine neue Umgebungsvariable über
sysdm.cpl
allein hat nicht funktioniert. Für andere Windows-Benutzer, ich empfehle das hinzufügenC:\Program Files (x86)\Tesseract-OCR
zu Ihremprofile.ps1
sowie (wenn mit Powershell).Kleiner Fehler-ich wusste, ich hatte zu öffnen/schließen-meine cmd zu bekommen, wird der aktualisierte Pfad zu reflektieren. Mit Jupyter Notebook hatte ich zum Herunterfahren der client-und re-initialisieren Sie es auch.
Den folgenden drei Befehle tun das nötige :
Haben Sie wahrscheinlich verschiedene Versionen von Python installiert, sicherzustellen, dass die installierten Tesseract ist auf die gleiche Python version.
which pip3
zeigt Ihnen den Pfad zu der pip3-installation undwhich python3
zeigt den entsprechenden Pfad zur Python-installation.Sicherzustellen, dass diese beiden identisch sind.
War ich auch vor dem gleichen Fehler, wenn ich versuche zu machen, eine text-Extraktor mit pytesseract, aber die Lösung war es in den Installationsanleitungen für pytesseract im pypi Seite: pytesseract
Es gibt viele alternativen, um den Fehler zu vermeiden,
Aber, das hinzufügen eines weiteren Parameters in der Methode pytesseract.image_to_string gelöst es für mich, wie
Dies geschieht unter windows (zumindest in tesseract-version 3.05), wenn das aktuelle Verzeichnis auf einem anderen Laufwerk, von dem tesseract installiert ist.
Etwas in tesseract erwartet Daten-Dateien werden in \Program Files... (anstatt C:\Program Dateien, sagen). Also, wenn Sie nicht auf dem gleichen Laufwerkbuchstaben wie tesseract, wird es scheitern. Es wäre toll, wenn könnten wir es umgehen, vorübergehend ändern-Laufwerke (nur unter windows), um den tesseract-installation-Laufwerk vor dem ausführen von tesseract, und ändern zurück nach.
Beispiel in Ihrem Fall: Sie kopieren können yourmodule_python.py auf "C/Programme (x86)/Tesseract-OCR/" und FÜHREN!