NLTK 3 POS_TAG wirft UnicodeDecodeError

Hallo, ich versuche zu lernen NLTK. Ich bin neu in Python auch. Ich versuche das folgende.

>>import nltk
>>nltk.pos_tag(nltk.word_tokenize("John lived in China"))

Bekomme ich die folgende Fehlermeldung

Traceback (most recent call last): File "", line 1, in

nltk.pos_tag(nltk.word_tokenize("John lebte in Kalifornien")) File "C:\Python34\lib\site-packages\nltk\tag__init__.py", line 100,
in pos_tag
tagger = load(_POS_TAGGER) - Datei "C:\Python34\lib\site-packages\nltk\data.py" Linie 779 im laden
resource_val = pickle.Belastung(opened_resource) UnicodeDecodeError: 'ascii' codec kann nicht decodieren byte 0xcb in position 0: ordinal not in
range(128)

Heruntergeladen habe ich alle Modelle erhältlich (auch die maxent_treebank_pos_tagger)

Den default system encoding ist UTF-8

>>sys.getdefaultencoding()

Öffnete ich die data.py Datei-und dies ist der Inhalt verfügbar.

774# Load the resource.
775    opened_resource = _open(resource_url)
776if format == 'raw':
777            resource_val = opened_resource.read()
778        elif format == 'pickle':
779            resource_val = pickle.load(opened_resource)
780        elif format == 'json':
781            import json

Was mache ich hier falsch?

Schreibe einen Kommentar