Solr: Was sind die Vorteile der Länge Normalisierung/omitNorms=false?

Sind wir mit Solr für die Suche von Artikeln in verschiedenen Längen. Wir der index sowohl beschreibende Metadaten (Titel, Autor, Kategorie, Stichwörter, etc) und den kompletten Artikel-text. Wir tun nicht steigern Relevanz zum Zeitpunkt der index - steigert alle fertig sind zum Zeitpunkt der Abfrage (wir verwenden dismax, gepaart mit verschiedenen qf, pf und bf erhöht).

Derzeit unsere Volltext-Feld verwendet die standard-omitNorms=false; und als ein Ergebnis, alles andere gleich, kürzere Artikel (Spalte 2-3 Zoll Artikel) wird Häufig eine höhere Relevanz als mehr feature-Länge (multi-Seite) Artikel.

In unserem Fall die Länge der Artikel ist ein wesentlicher Indikator für Relevanz, und so überlege ich, die Einstellung omitNorms=true auf unsere Volltext-Feld.

Fragen: 1. Warum ist das Standard lucene/solr Verhalten zu steigern, kürzere Feld-Längen über höher? Was ist der Grund?
2. Warum würde ich nicht wollen omitNorms? Ich brauche nicht zu steigern Abfragen, die auf diesem besonderen Feld, noch jegliche Art der Facettierung auf diesem Gebiet.

Schreibe einen Kommentar