Tag: inverted-index

Invertierter index ist ein index-Datenstruktur zur Speicherung einer Zuordnung von Inhalten, wie Wörter oder zahlen, um die Standorte in einer Datenbank-Datei oder in ein Dokument oder eine Reihe von Dokumenten. Der Zweck eines invertierten index ermöglichen eine schnelle Volltext-Suche, die Kosten erhöht, die Verarbeitung, wenn ein Dokument der Datenbank Hinzugefügt wird.

Lucene ' s Algorithmus

Anzahl der Antworten 1 Antworten
Ich lese die Zeitung von Doug Cutting; "Raum-Optimierungen für die Gesamtwertung". Da war es vor langer Zeit geschrieben, Frage ich mich, welche algorithmen lucene verwendet (Bezug auf postings list traversal-und score-Berechnung, ranking). Insbesondere, die gesamten ranking-Algorithmus beschrieben,

Java-Inverted-Index-Programm

Anzahl der Antworten 3 Antworten
Schreibe ich eine inverted-index-Programm auf java gibt die Häufigkeit von Begriffen in mehreren Dokumenten. Ich habe in der Lage gewesen, um die Anzahl, wie Häufig ein Wort wird in der gesamten Sammlung, aber ich habe nicht in

Laden eines großen Wörterbuchs mit python pickle

Anzahl der Antworten 5 Antworten
Ich habe eine volle invertierte index in form des nested-python-dictionary. Seine Struktur ist : {word : { doc_name : [location_list] } } Zum Beispiel lassen Sie das Wörterbuch aufgerufen werden index, dann für ein Wort "spam" -

Invertierter index aus einer Liste von Dokument-Token mit python?

Anzahl der Antworten 1 Antworten
Ich bin ein Neuling auf python. Ich brauche zum erstellen eines invertierten index-Funktion, die eine Liste mit Dokument-Token. Der index ordnet jede eindeutige Wort, um eine Liste von Dokument-ids sortiert in aufsteigender Reihenfolge. Mein code: def create_index(tokens):