Wikipedia Text herunterladen

Ich bin auf der Suche nach download vollständigen Wikipedia-text für meine college-Projekt. Muss ich schreiben, dass meine eigenen spider zu downloaden oder ist es eine öffentliche Datensatz, Wikipedia online verfügbar?

Nur geben Ihnen einige überblick über mein Projekt, ich möchte, um herauszufinden, die interessante Worte, von wenigen Artikeln, die ich mich interessiere. Aber zu finden, diese interessanten Worte, ich bin Planung zu übernehmen tf/idf an, berechnen Begriff Frequenz für jedes Wort und jeden pick diejenigen, die mit hoher Frequenz. Aber zur Berechnung der tf, die ich brauche, um zu wissen, die Gesamtanzahl der vorkommen in der ganzen Wikipedia.

Wie kann das getan werden?

InformationsquelleAutor der Frage Boolean | 2010-04-21

Schreibe einen Kommentar