NLTK Kontext-Freie Grammatik Genaration

Arbeite ich an einem nicht-Englisch-parser mit Unicode-Zeichen. Für dass ich mich entschieden habe, NLTK.

Aber es erfordert einen vordefinierten Kontext-freie Grammatik wie folgt:

  S -> NP VP
  VP -> V NP | V NP PP
  PP -> P NP
  V -> "saw" | "ate" | "walked"
  NP -> "John" | "Mary" | "Bob" | Det N | Det N PP
  Det -> "a" | "an" | "the" | "my"
  N -> "man" | "dog" | "cat" | "telescope" | "park"
  P -> "in" | "on" | "by" | "with" 

In meiner app, ich soll zu minimieren, hard-Codierung mit dem Einsatz von Regel-basierten Grammatik.
Zum Beispiel kann ich davon ausgehen, jedes Wort endet mit -ed oder -ing als verb. Daher sollte es für jeden gegebenen Kontext.

Wie kann ich füttern Grammatik-Regeln zu NLTK? Oder generieren Sie dynamisch mittels Finite-State-Maschine?

  • Sie können gerne Lesen diese Antwort denn Sie schreiben CFG.
  • Danke. Ich schaute, aber konnte es nicht verstehen. Gibt es eine Möglichkeit, ich kann füttern, python Variablen CFG ?
  • Wenn Sie wollen, um automatisch zu lernen CFG-Regeln, können Sie versuchen, die Umsetzung dieser www.aclweb.org/anthology/O06-1004 =)
InformationsquelleAutor ChamingaD | 2013-07-17
Schreibe einen Kommentar