ElasticSearch Datum Auswahl-Abfrage-aggregation mit Hilfe der Java-API

Hallo ich habe das Dokument für die cpu-Auslastung mit date_time Feld drin. Nun würde ich gerne erfahren, avg cpu-Auslastung für den Datumsbereich. Ich komme mit der folgenden Lösung. Bitte lassen Sie mich wissen, wenn es irgendwelche vorab-oder der bessere Ansatz ist, wie ich bin neu auf Elastic Search.

client.prepareSearch("myindex").
       setTypes("mytype").
       setQuery(
           QueryBuilders.filteredQuery(QueryBuilders.matchAllQuery(),
           FilterBuilders.andFilter(FilterBuilders.termFilter("server","x"),
           FilterBuilders.rangeFilter(date_time).from(fdate).to(tdate)))).get()

Nun obige Abfrage gibt mir wie erwartet Unterlagen die fällt innerhalb von/bis Datumsbereich. Nun, was ich versuche zu tun ist, ich finde alle einzigartigen Daten aus diesen Dokumenten mit SearchHitsund ich speichern Sie diese einzigartige Kombinationen von Daten in einer HashSet und jetzt für alle Elemente innerhalb dieses HashSet ich führen Sie die folgende Abfrage

client.prepareSearch("myindex").
       setTypes("mytype").
       setQuery(
           QueryBuilders.filteredQuery(QueryBuilders.matchAllQuery(),
           FilterBuilders.andFilter(FilterBuilders.termFilter("server","x"),
           FilterBuilders.termFilter(date_time),"dateinputfromloop"))).
       addAggregation(AggregationBuilders.avg("cpu_agg").field("cpu_time"))
       .get()

Nun obige Abfrage funktioniert einwandfrei und gibt die Ausgabe, die ich bekommen avg-CPU für jedes Datum-Zeit-Kombination. Ich Frage mich, ob diese besser ist-Ansatz führe ich vor der Abfrage in einer Schleife für alle Datum-Kombinationen. Bitte Anleitung danke im Voraus.

Also, wie ist dein date gespeichert ist? Ich meine, ist es mm/TT/JJ oder mit der Zeit, Wie Sie finden, wenn Datum einzigartig ist?
Hi danke für die Antwort. Datum ist gespeichert in ISO-Datumsformat. Kann es ähnliche/doppelte Datum pro Dokument, so bin ich das speichern in HashSet und dann, nachdem ich haben einzigartige date-Kombinationen, eins nach dem anderen ich bin brennen Abfrage zu bekommen avg-cpu für jedes Datum.

InformationsquelleAutor u449355 | 2014-08-10

elasticsearch java

8

So, ich denke, man kann Daten für den täglichen,
Sie können date_histogram aggregation für diese. So, dass Ihre zwei Wunsch getan werden kann, im einzelnen Anforderung.

Hier ist der code,
```
client.prepareSearch("myindex").
                setTypes("mytype").
                setQuery(
                        QueryBuilders.filteredQuery(QueryBuilders.matchAllQuery(),
                                FilterBuilders.andFilter(FilterBuilders.termFilter("server","x"),
                                        FilterBuilders.rangeFilter("date_time").from("fdate").to("tdate")))).
                addAggregation(
                        AggregationBuilders.dateHistogram("dateagg").field("date_time").interval(DateHistogram.Interval.DAY)
                                .subAggregation(
                                AggregationBuilders.avg("cpu_agg").field("cpu_time")
                        )
                )
                .get();
```
Ändern Sie können das Intervall in dateHistogram aggregation um Ihren Bedarf zu passen.

Wenn Sie möchten, werden, basierend auf eindeutigen (in Millisekunden auch), dann kannst du Sie verwenden Begriffe aggregation-Datum anstelle des Datums Histogramm-aggregation.

Begriffe Aggregation

Multi-bucket-Wert-source-basierte aggregation wo Eimer sind
dynamisch erstellt - eine für jeden eindeutigen Wert.

Hoffe, das hilft, Danke.
- Vielen Dank für die Antwort. Also, die mit Ihrer Lösung ich brauche eine Schleife, die für jedes Datum die Kombination dieser einer Abfrage werden alles tun, job. Mein Datums-format sieht wie 2014-07-25T10:25:00:000.Z, und es kann die Kombination in Bezug auf Sekunden oder mili Sekunde Unterschied. Ich finde avg für alle diese Kombinationen von Datum Histogramm tun es für mich.
- Ich denke, es wird funktionieren, Es hängt davon ab, wie Sie die Gruppe geht oder wie man bedenkt, einzigartig. ich.e, wenn zwei Ereignisse aufgetreten, im Abstand von 1 Millisekunde, ist es anders??? wenn es ist, dann Sie können ändern, interval =1 , so Millisekunde unterstützt wird (habe zum test). Nur das Intervall ändern, jedes mal, wenn-format unterstützt wird.
- Ich habe aktualisiert die Antwort, zu sehen, ob es hilft.
- Hi es funktionierte erstaunlich. Nur eine Abfrage gibt mir sortiert ausgegeben. Ich wünschte, ich könnte geben Sie +10!
- Froh, dass ich helfen kann..
- Vielen Dank hat mir geholfen, so gut 🙂
InformationsquelleAutor progrrammer

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.