Wie man einen einfachen invertierten index?

Ich möchte erstellen Sie eine einfache Funktion Indizierung der Suchmaschine, ohne API, wie Lucene. In den invertierten index, brauche ich nur zu erfassen, grundlegende Informationen zu jedem Wort, z.B. docID, position und freqence.

Nun, ich habe mehrere Fragen:

  1. Welche Art von Daten Struktur wird Häufig für den Aufbau invertierter index? Mehrdimensionale Liste?

  2. Nach Aufbau des index, wie es zu schreiben in Dateien? Welche Art von format in der Datei? Wie eine Tabelle? Wie beim index-Tabelle auf Papier?

InformationsquelleAutor der Frage Munichong | 2012-09-20

Schreibe einen Kommentar