Was ist der Unterschied zwischen corpus und Lexikon in NLTK (python)
Kann mir jemand sagen der Unterschied zwischen einer Corpora ,corpus und Lexikon in NLTK ?
Was ist der movie data set ?
was ist Wordnet ?
- Es ist bevorzugt, wenn Sie buchen können, trennen Sie Fragen, anstatt zu kombinieren, Ihre Fragen in einem. So, es hilft den Menschen, die Beantwortung Ihrer Frage und auch andere, die der Jagd für mindestens eine Ihrer Fragen. Danke!
- hey Rohit, thx für den Kommentar...ich Hinzugefügt, obwohl dies, wie Sie alle miteinander verwandt sind...answeting eine im Kontext der anderen helfen würde, ich glaube...
- Es ist nicht
machine-learning
per se, aber es ist mehr NLTK und nlp.
Du musst angemeldet sein, um einen Kommentar abzugeben.
Corpora ist die plural für corpus.
Corpus im Grunde bedeutet, einen Körper, und im Zusammenhang mit der Verarbeitung Natürlicher Sprache (NLP), es bedeutet, einen Körper von text.
(Quelle: https://www.google.com.sg/search?q=corpora)
Lexikon ist ein Vokabeltrainer, der eine Liste von Wörtern, ein Wörterbuch (Quelle: https://www.google.com.sg/search?q=lexicon)
In NLTK, jedem Lexikon ist als ein corpus da eine Liste von Wörtern ist auch Fließtext. E. g. eine Liste mit Stoppwörtern finden Sie in NLTK corpus-API:
Den Film-Kritik-dataset in NLTK (kanonisch bekannt als
Movie Reviews Corpus
) ist ein text dataset 2k-Film-Beiträge mit sentiment polarity classification (Quelle: http://www.nltk.org/book/ch02.html)Und es ist Häufig verwendet, für die tutorial Zwecke, für die Einführung in NLP und die sentiment-Analyse, siehe http://www.nltk.org/book/ch06.html und nltk NaiveBayesClassifier training für sentiment-Analyse
WordNet ist lexikalische Datenbank für die englische Sprache (es ist wie ein Lexikon/Wörterbuch mit Wort-zu-Wort-Beziehungen) (Quelle: https://wordnet.princeton.edu/).
In NLTK integriert, die das Öffnen Mehrsprachige WordNet ( http://compling.hss.ntu.edu.sg/omw/ ), die es Ihnen ermöglicht die Abfrage der Wörter in anderen Sprachen.
Da es auch eine Liste von Wörtern (in diesem Fall mit vielen anderen Dingen enthalten, Beziehungen, Lemmata, POS, etc.), es ist auch aufgerufen, mit
nltk.corpus
in NLTK.Den kanonischen idiom zu verwenden, die wordnet in NLTK ist als solche:
Der einfachste Weg, um zu verstehen/lernen Sie die NLP-jargons und der Grundlagen ist, um durch die Anleitung in der NLTK-book: http://www.nltk.org/book/