Wie installiere Englisch.Gurke für nltk auf einer off-line-Linux-Maschine
Ich versuche zu laufen nltk auf einem SUSE-Linux-box, die nicht mit dem internet verbunden sein.
Habe ich erfolgreich nltk installiert und es läuft aber wenn ich senden
>>> tagged = nltk.pos_tag(tokens)
Bekomme ich diesen Fehler:
LookupError:
**********************************************************************
Ressource 'tokenizer/punkt/Englisch.Gurke' nicht
gefunden. Bitte verwenden Sie die NLTK
Downloader das sammeln der Ressource:
Ich nicht verwenden können, die downloader, da kann ich nicht schließen Sie die box an das internet.
Nicht jemand, wie ich die erforderlichen Pakete installieren können?
Du musst angemeldet sein, um einen Kommentar abzugeben.
Daten heruntergeladen
nltk_data
- Verzeichnis. Wo das ist, unterscheidet sich von einem system zum anderen, aber Sie können herausfinden, indem Sie Folgendes tun:english.pickle
sollten in einem Unterordner von<nltk_data>/taggers/
. Der einfachste Weg, um es gibt es zu verwenden Sie den downloader auf einem Computer, der über Internetzugang verfügt, dann kopieren Sie es und legen Sie es in den gleichen Unterordner. Es gibt nur eine version vonenglish.pickle
, und Sie können es herunterladen auf einen Windows-Rechner, kein problem.Der downloader speichert die Dateien in einem bestimmten Ordner. Ich kann mir vorstellen es ist möglich, die zum download auf ein online-Rechner und kopieren Sie die Dateien auf die vergleichbaren Ort auf Ihrem offline-Rechner. Auf meiner Maschine ist es downloads zu
/usr/local/lib/nltk_data
.Referenz (ab 2017), punkt tokenizer finden Sie unter diesem link bei GitHub:
https://github.com/nltk/nltk_data/blob/gh-pages/packages/tokenizers/punkt.zip
Sollten Sie in der Lage sein, um download von einer nicht-airgapped Maschine, und verschieben Sie es auf ein flash-Laufwerk.