Python-NLTK vs. zugehörigen Java-Bibliotheken?

Ich verwendet habe, LingPipe, Stanford NER, RiTa und verschiedene Satz ähnlichkeit Bibliotheken für meine bisherigen Java-Projekte, die sich auf text (vor -) Verarbeitung (Indexierung, xml-tagging, topic detection, etc.) große Mengen der englische text (rund 10.000 Dokumente Summen - > 1 GB text). Vielleicht bin ich eine schlechte Java-Programmierer, aber ich finde mich bei der Eingabe eine Menge code, und verwenden Sie eine Menge von Bibliotheken, wenn ich schalte auf einen anderen Korpus. Insgesamt habe ich das Gefühl, dass dort vielleicht ein besseres Werkzeug für den job.

Ich denke, meine Frage ist, werde ich ein Umstieg auf Python und NLTK für information retrieval /language processing? Oder gibt es genug vor-und Nachteile zu machen, sehr subjektiv? Ist NLTK intuitiv genug, um gelernt werden schnell?

Ich würde mir meine Hände schmutzig, aber ich gewann ' T haben Zugang zu einer persönlichen Maschine für die nächsten Tage.

InformationsquelleAutor wnewport | 2011-04-08
Schreibe einen Kommentar