Ändern nltk.download () - Pfad Verzeichnis von standardmäßig ~/ntlk_data
Ich versucht habe, zu download/update-python - nltk
- Pakete auf einem Rechner server und es kamen in diesem [Errno 122] Disk quota exceeded:
Fehler.
Speziell:
[nltk_data] Downloading package stop words to /home/sh2264/nltk_data...
[nltk_data] Error downloading u'stopwords' from
[nltk_data] <https://raw.githubusercontent.com/nltk/nltk_data/gh-
[nltk_data] pages/packages/corpora/stopwords.zip>: [Errno 122]
[nltk_data] Disk quota exceeded:
[nltk_data] u'/home/sh2264/nltk_data/corpora/stopwords.zip
False
Wie könnte ich den gesamten Pfad für nltk
Pakete, und welche änderungen sollte ich machen, um sicherzustellen, fehlerfreies laden von nltk
?
Du musst angemeldet sein, um einen Kommentar abzugeben.
Diese können so konfiguriert werden, sowohl auf der Kommandozeile (
nltk.download(..., download_dir=)
oder per GUI. Bizarr nltk scheint völlig zu ignorieren, Ihre eigenen UmgebungsvariablenNLTK_DATA
- und Standard-download-Verzeichnisse, um ein standard-set von fünf Pfade, unabhängig davon, obNLTK_DATA
definiert ist und wo es Punkte, und zwar unabhängig davon, ob nltk fünf default-Verzeichnisse noch existieren, auf die Maschine oder der Architektur(!). Einige, die dokumentiert ist in Installation NLTK-Daten, obwohl es unvollständig ist und ein bisschen begraben; nachstehend wiedergegeben mit sehr viel klareren Formatierung:Nun was empfohlen Weg NLTK_DATA verwenden sollten, nltk nicht wirklich geben, keine richtige Führung, aber es sollte ein generisches standalone-Pfad nicht unter allen installieren Baum (also nicht unter
<python-install-directory>/lib/site-packages
) oder andere Nutzer dir. Daher/usr/local/share
,/opt/share
oder ähnliches. Auf MacOS 10.7+,/usr
und damit/usr/local/
diesen Tagen sind standardmäßig ausgeblendet, so/opt/share
kann gut sein, eine bessere Wahl. Oder tunchflags nohidden /usr/local/share
.sudo python -m nltk.downloader -d /usr/local/share/nltk_data stopwords
sudo python -m nltk.downloader -d /usr/local/share/nltk_data stopwords wordnet punkt
Entsprechend der Dokumentation:
Angeben, download-Verzeichnis, zum Beispiel:
NLTK GUI gestartet werden kann von PyCharm Community Edition Python-Konsole zu.
Nur Problem 2 Befehle:
1) import nltk
2) nltk.download_gui()
aber nltk GUI wird nicht funktionieren, wenn Sie sich hinter einem proxy-server, in der console müssen Sie zuerst die proxy-Einstellung
SET HTTP_PROXY=proxy.MeineFirma.com:8080
und dann wird es funktionieren.
Können Sie auch
nltk.download_shell()
und befolgen der interaktiven Schritte, wie unten gezeigt.Verwenden auch
nltk.data.path.append('/your/new/data/directory/path')
zu beauftragen nltk zum laden von Daten aus neuen Daten Weg.