NLTK und Spracherkennung
Wie kann ich erkennen, in welcher Sprache ein text geschrieben ist mit NLTK?
Die Beispiele, die ich gesehen habe verwenden nltk.detect
aber wenn ich es installiert auf meinem mac, ich kann nicht finden, dieses Paket.
InformationsquelleAutor der Frage niklassaers | 2010-07-05
Du musst angemeldet sein, um einen Kommentar abzugeben.
Haben, kommen Sie über den folgenden code-snippet?
vom http://groups.google.com/group/nltk-users/browse_thread/thread/a5f52af2cbc4cfeb?pli=1&safe=active
Oder die folgende demo-Datei?
https://web.archive.org/web/20120202055535/http://code.google.com/p/nltk/source/browse/trunk/nltk_contrib/nltk_contrib/misc/langid.py
InformationsquelleAutor der Antwort William Niu
Diese Bibliothek ist nicht von NLTK, entweder, aber sicherlich hilft.
Unterstützten Python-Versionen 2.6, 2.7, 3.x.
https://pypi.python.org/pypi/langdetect?
P. S.: erwarte nicht, dass dies korrekt funktioniert immer:
InformationsquelleAutor der Antwort SVK
Obwohl dies nicht in das NLTK, ich habe tolle Ergebnisse mit einem weiteren Python-basierte Bibliothek :
https://github.com/saffsd/langid.py
Dies ist sehr einfach zu importieren und beinhaltet eine große Anzahl von Sprachen in Ihrem Modell.
InformationsquelleAutor der Antwort burgersmoke