Praktische Grenzen von ElasticSearch + Cassandra
Ich bin der Planung über die Verwendung von ElasticSearch index meine Cassandra-Datenbank. Ich Frage mich, ob jemand gesehen hat, sind die praktischen Grenzen von ElasticSearch. Dinge tun, die langsam in den petabyte-Bereich? Auch, hat jemand irgendwelche Probleme mit ElasticSearch index Cassandra?
InformationsquelleAutor der Frage Henry | 2011-06-15
Du musst angemeldet sein, um einen Kommentar abzugeben.
Sehen dieser thread von 2011, die erwähnt ElasticSearch-Konfigurationen mit 1700 Scherben jeder von 200GB, in der 1/3 petabyte-Bereich. Ich würde erwarten, dass die Architektur von ElasticSearch unterstützen würden nahezu unbegrenzte horizontale Skalierbarkeit, da jeder shard-index funktioniert unabhängig von allen anderen shards.
Den praktischen Grenzen (das gilt für jede andere Lösung auch) die Zeit benötigt, um tatsächlich zu laden, dass viele Daten in den ersten Platz. Die Verwaltung eines Cassandra-Clusters (oder einer anderen verteilten datenspeicher), die Größe wird auch erhebliche Arbeitsbelastung gerade für die Wartung, load balancing etc.
InformationsquelleAutor der Antwort DNA
Soigne ist das Unternehmen kimchy spielt in diesem thread. Wir haben über ein petabyte an AWS über mehrere ES-Cluster. Es ist keine technische Begrenzung, wie weit Sie horizontal skalieren Sie ES, aber als DNA erwähnt, gibt es praktische Probleme. Die größte ist bei weitem Netzwerk. Es gilt für jeden verteilten Speicherung von Daten. Sie bewegen sich nur so viel über den Draht zu einem Zeitpunkt. Wenn ES zur Wiederherstellung nach einem Ausfall, es hat, um Daten zu verschieben. Die beste option ist die Verwendung von kleineren Scherben über weitere Knoten (gleichzeitige übertragung), jedoch besteht die Gefahr einer höheren rate des Scheiterns und der exorbitanten Kosten pro byte.
InformationsquelleAutor der Antwort drewr
ALS DNA-erwähnt, 1700 Scherben, aber es ist nicht 1700 Scherben, aber es gibt 1700 Indizes mit jeweils 1 Shards und 1 replica. So ist es durchaus möglich, dass diese 1700 Indizes sind nicht auf eine einzige Maschine, sondern aufgeteilt auf mehrere Maschinen.
So ist das nie ein problem
InformationsquelleAutor der Antwort Harsh Gupta
Ich bin derzeit am Beginn der Arbeit mit Elisandra (Elasticsearch + Cassandra)
Bin ich auch, Probleme, index Cassandra mit elasticsearch. Mein problem ist im Grunde die Knoten-Konfiguration.
Tun
$ nodetool status
sehen SieHost ID
und dann ruinieren:curl -XGET http://localhost:9200/_cluster/state/?pretty=true
Können Sie überprüfen, ob eine der
node:
ist der gleiche name wieHost ID
InformationsquelleAutor der Antwort isaura almar