Erzeugung von Zufallszahlen Sätze von benutzerdefinierten text in Python-NLTK?

Ich habe Probleme mit dem NLTK unter Python, speziell die .generate () - Methode.

generieren(self, length=100)

Print random text, generiert mit einem Trigramm Sprachmodell (language model).

Parameter:

   * length (int) - The length of text to generate (default=100)

Hier ist eine vereinfachte version von dem, was ich bin versucht.

import nltk

words = 'The quick brown fox jumps over the lazy dog'
tokens = nltk.word_tokenize(words)
text = nltk.Text(tokens)
print text.generate(3)

Diese wird immer generieren

Building ngram index...
The quick brown
None

Als gegen einen zufälligen Satz aus den Wörtern.

Hier ist meine Ausgabe, wenn ich

print text.generate()

Building ngram index...
The quick brown fox jumps over the lazy dog fox jumps over the lazy
dog dog The quick brown fox jumps over the lazy dog dog brown fox
jumps over the lazy dog over the lazy dog The quick brown fox jumps
over the lazy dog fox jumps over the lazy dog lazy dog The quick brown
fox jumps over the lazy dog the lazy dog The quick brown fox jumps
over the lazy dog jumps over the lazy dog over the lazy dog brown fox
jumps over the lazy dog quick brown fox jumps over the lazy dog The
None

Wieder angefangen mit dem gleichen text, aber dann variiert werden. Ich habe auch versucht, mit dem ersten Kapitel aus Orwells 1984. Wieder, dass immer beginnt mit dem ersten 3-Token (eines davon ist ein Raum in diesem Fall) und dann geht auf, um nach dem Zufallsprinzip generieren text.

Was mache ich hier falsch?

Schreibe einen Kommentar