Genaue übereinstimmungen mit ElasticSearch (zum Zeitpunkt der Abfrage)

Habe ich eine Orte-index, die viele der Ortsnamen und Ihren jeweiligen Ländern.

Dann möchte ich wissen, ob wir haben Standorte mit dem Titel "Berlin" in das Land mit country code "DE".

Hier mein Java-code-Versuch:

SearchResponse response = client.prepareSearch("locations")
                .setQuery(QueryBuilders.matchQuery("title", "Berlin"))
                .setFilter(FilterBuilders.termFilter("country", "DE"))
                .execute()
                .actionGet();

Aber das gibt mir zu viele Antworten, z.B. Ergebnisse für "Zoo Berlin" und so weiter. Ich brauche genaue übereinstimmungen.

(Beachten Sie aber bitte, dass ich andere Szenarien, in denen diese Zeichenfolge/text search-matching gewünscht ist.)

Gibt es eine Möglichkeit, zu entscheiden, auf die Abfrage, und nicht an der Indizierung, die das Verhalten (exakt vs. analysierten text) man will?

Durch exakte übereinstimmung, meinst du "berlin" sollte übereinstimmen "Berlin"?
Ja, zum Beispiel. (Und ich kümmere mich nicht zu viel über den Fall hier.) Aber wenn "Berlin" passt zu "Berlin Hauptbahnhof", das ist problematisch.

InformationsquelleAutor Michael Junk | 2013-08-23

elasticsearch java

10

Index das Feld ausführen ein Begriff, der filter auf als not_analyzed. Beispielsweise können Sie index das Feld "Land" als multi_field, mit einem der sub-Felder not_analyzed:
```
        "country": {
            "type": "multi_field",
            "fields": {
                "country": {"type": "string", "index": "analyzed"},
                "exact": {"type": "string","index": "not_analyzed"}
            }
        }
```
Zusätzlich, Sie könnte das gleiche tun mit dem "Titel" - Feld, um einen Begriff-Abfrage:
```
        "title": {
            "type": "multi_field",
            "fields": {
                "title": {"type": "string", "index": "analyzed"},
                "exact": {"type": "string","index": "not_analyzed"}
            }
        }
```
Dann zum Zeitpunkt der Abfrage, ob Sie möchten, dass ein Titel mit der genauen Bezeichnung "Berlin", gefiltert nach den genauen Begriff, "DE", einen Begriff-Abfrage-und-Sicht-filter mit der not_analyzed Felder:
```
SearchResponse response = client.prepareSearch("locations")
                .setQuery(QueryBuilders.termQuery("title.exact", "Berlin"))
                .setFilter(FilterBuilders.termFilter("country.exact", "DE"))
                .execute()
                .actionGet();
```
Beachten Sie, dass Begriff filtern und Laufzeit Abfragen erfordern not_analyzed Bereichen zu arbeiten (z.B., um genaue übereinstimmungen zurückgeben).
- Gibt es eine Möglichkeit, durchführen die not_analyzed-Abfrage zur Abfrage der Zeit, ohne änderung der Zuordnung?
- Sicher nicht. Sie können die update-API zum hinzufügen eines Analysators auf Ihren index, und geben Sie analyzer zum Zeitpunkt der Abfrage. Finden Sie unter diesem SO Frage. Allerdings, ich weiß nicht, ob Sie angeben können, index: not_analyzed ohne änderung der Zuordnung.
- Nach elasticsearch.org/guide/en/elasticsearch/guide/current/... das mapping geändert werden muss ("das Löschen der index zunächst ist erforderlich, da wir Sie nicht ändern Zuordnungen, die bereits existiert.")
- Mit Hilfe der .Zeichenkette, nach der der name der Eigenschaft ist nicht für mich arbeiten. Ich bin nur mit dem termQuery kein filter.
InformationsquelleAutor Scott Rice

Mit Version 5 + auf ElasticSearch gibt es kein Konzept von analysierten und nicht analysierten index, dessen Gefahren von Typ !

Datentyp "String" ist veraltet und wird ersetzt mit text und Keywords, so dass, wenn Ihr Datentyp ist text, es verhält sich wie string und können analysiert und tokenisiert.

Aber wenn die Datentyp ist definiert als Schlüsselwort dann automatisch seine NICHT analysiert, und kehren Sie voller exakte übereinstimmung.

ALSO Sie sollten nicht vergessen, markieren Sie die Art, wie ein Schlüsselwort, wenn Sie wollen, zu tun, genau passend.

und Sie können verwenden den gleichen Begriff, der Abfrage und Ausdruck filter, wie beschrieben von @Scott Reis.

code-Beispiel für das erstellen index mit dieser definition, Hinweis, dass ich erstellt habe, zwei Typen für jedes Feld eine als tokenizable so geben Sie text und andere genau so geben wird, Schlüsselwort, einige Male, Ihr nützlich zu halten, sowohl für bestimmte Felder:

PUT testindex
{
    "mappings": {
      "original": {
        "properties": {
          "@timestamp": {
            "type": "date"
          },
          "@version": {
            "type": "text",
            "fields": {
              "keyword": {
                "type": "keyword",
                "ignore_above": 256
              }
            }
          },
          "APPLICATION": {
            "type": "text",
            "fields": {
                "token": {"type": "text"},
                "exact": {"type": "keyword"}
            }
          },
          "type": {
            "type": "text",
            "fields": {
                "token": {"type": "text"},
                "exact": {"type": "keyword"}
            }
          }
        }
      }
    }
  }

InformationsquelleAutor Dean Jain

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.