Wie kann ich filter über die Daten in Cassandra?

Ich habe mit mySQL eine app für einige Zeit, und je mehr Daten ich sammle, desto langsamer wird es. Also ich habe auf der Suche in NOSQL-Optionen. Eines der Dinge, die ich in mySQL ist eine Ansicht aus einer Reihe von joins. Die app zeigt alle wichtigen Infos in einem raster, und der Benutzer kann auswählen von Bereichen, tun, suchen, etc. Auf diese Daten einstellen. Standard-Abfrage-Zeug.

Blick auf Kassandra, ist alles schon sortiert, basierend auf den Parametern, die ich in meinem storage-conf.xml. Also ich hätte die eine bestimmte Zeichenfolge als mein Schlüssel in der SuperColumn, und halten Sie einen Haufen von Daten in den Spalten darunter. Aber ich kann nur Sortieren nach einer Spalte, und ich kann das nicht real Suche in den Spalten ohne ziehen alle SuperColumns, und die Schleife durch die Daten, richtig?

Ich will nicht zu duplizieren, Daten über verschiedene ColumnFamilies, so möchte ich sicherstellen, dass Cassandra ist angemessen für mich. In Facebook, Digg, Twitter, Sie haben viel von der Suche Funktionen, also vielleicht bin ich einfach nicht sehen, die Lösung.

Gibt es eine Möglichkeit mit Cassandra bei mir zu suchen oder filter, die bestimmte Datenwerte in einem SuperColumn, oder dessen zugehörigen Spalte(N)? Wenn nicht, ist es eine andere NOSQL-option?

Im Beispiel unten, es scheint, ich kann nur Abfrage für phatduckk, friend1,John, etc. Aber was, wenn ich finden wollte, jemand, der in der ColumnFamily, lebte in der Stadt == "Beverley Hills"? Kann es getan werden, ohne wieder alle Rekorde? Wenn dem so ist, könnte ich eine Suche für die Stadt == "Beverley Hills" UND Status == "CA"? Es scheint nicht, wie ich tun kann, entweder, aber ich wollen, stellen Sie sicher, und sehen, was meine Optionen sind.

AddressBook = { //this is a ColumnFamily of type Super
  phatduckk: {    //this is the key to this row inside the Super CF
    friend1: {street: "8th street", zip: "90210", city: "Beverley Hills", state: "CA"},
    John: {street: "Howard street", zip: "94404", city: "FC", state: "CA"},
    Kim: {street: "X street", zip: "87876", city: "Balls", state: "VA"},
    Tod: {street: "Jerry street", zip: "54556", city: "Cartoon", state: "CO"},
    Bob: {street: "Q Blvd", zip: "24252", city: "Nowhere", state: "MN"},
  }, //end row
  ieure: {     
    joey: {street: "A ave", zip: "55485", city: "Hell", state: "NV"},
    William: {street: "Armpit Dr", zip: "93301", city: "Bakersfield", state: "CA"},
  },

}

InformationsquelleAutor Nathan | 2010-09-23

cassandra nosql

5

Du durchführen können diese Art von Operationen in Kassandra. Es gibt eine bestimmte Art von Auswahl Prädikate, die festgelegt werden können auf Spalte-Schlüssel, aber nichts auf dem Wert, den Sie halten. Blick auf die API und überprüfen get_slice/get_superslice und get_range Abfrage-Typen. Wieder, all dies ist über die Tasten in der ColumnFamily oder SuperColumnFamily nicht die Werte.

Wenn Sie wollen, dass die Art von Funktionalität, die Sie beschrieben haben, dann Ihre beste Wette ist, eine SQL-Datenbank. Bilden Sie korrekte Indizes auf den Tabellen, besonders auf die Spalten, die am meisten abgefragt und Sie sehen einen großen Unterschied in der Leistung von Abfragen. Hoffe, das hilft.
- Sie können tun, diese Art von Operationen mit anderen NOSQL-setup-Typ? Wie denken Sie, eine Website wie Facebook nicht die verschiedenen Arten von suchen/Abfragen, die Sie auf Ihrer Website mit Cassandra? Es gibt mehrere Möglichkeiten, um nach Daten zu suchen. Sie denken, dass Sie dupliziert wurden in einigen Orten und da gibt es eben mehrere ColumnFamilies so dass die Daten durchsucht wird, die in unterschiedlicher Weise?
- Es ist möglich, dass Sie das duplizieren der Daten auf verschiedenen Familien, das kann ich natürlich nicht sicher sein. Es ist eine option; ich bin mit Cassandra in ein bestimmtes Projekt zu verfolgen Aktivitäten von Benutzern, die Aktivitäten von Gruppen, etc, und ich habe erstellt eine Reihe von SuperColumnFamilies für die Fütterung/abrufen der jeweiligen updates. Alles, was ich zu tun, dann führen Sie einen look-up.
- Vielleicht, ich muss nur härter arbeiten, auf immer aus dem relationalen DB-Einstellung. Ich bin überzeugt es ist ein optimaler Weg, um meine Daten aus MySQL und die gleiche Funktionalität zu erhalten in der meine app in Kassandra. Vielen Dank für deinen input.
- Du bist herzlich willkommen 🙂 Eine Letzte kleine Eingang - im Falle der app-Daten-und Prozess-intensive-stick, eine SQL-Datenbank.
- Gut diese app sammelt Tonnen von Daten jeden Monat, so dass der Benutzer eine einfache Möglichkeit, zu sichten, aber es geht immer langsamer und langsamer, obwohl ich indiziert haben alle die entsprechenden Spalten ein und bisher war niemand in der Lage, um zu sehen, das problem mit den Abfragen. Also ich bin auf der Suche nach alternativen. Was kann ich versuchen, dabei ist die Schaffung EINER MENGE von ColumnFamilies. Wie im Beispiel oben, ich hätte eine Stadt, CF, Staat, CF, etc. Dann als Spalte in der CF, ein JSON-array von Benutzer-UUID, die im Zusammenhang mit der Stadt oder den Staat CF. Ich bin entschlossen, es ist ein Weg, um dies zu tun 🙂
InformationsquelleAutor Sagar V
6

Sie "wollen nicht zu duplizieren, Daten über verschiedene ColumnFamilies," aber das ist, wie man diese Art von Abfragen in Cassandra. Sehen http://maxgrinev.com/2010/07/12/do-you-really-need-sql-to-do-it-all-in-cassandra/
- Das ist wohl die Essenz der das abrufen von Daten in Cassandra. Wenn Sie möchten, Abfragen basierend auf einem Feld besser das Feld ein Schlüssel! Vielen Dank für diesen link. Mir hilft validieren viele meiner design-Entscheidungen, die ich zunächst fühlte, waren fragwürdig 🙂
- Ja, je mehr ich darüber nachdachte, desto mehr erkannte ich, dass durch das duplizieren der Daten, die ich Abfragen will aus der ist wie meine eigene index, das ist nicht unbedingt eine schlechte Sache. Ich Spiele mit mongoDB jetzt auch, aber ich kann wieder zurück wechseln. Nur tun, eine Menge Tests in den nächsten paar Wochen. Vielen Dank für diesen link, obwohl, es wirklich helfen!
InformationsquelleAutor jbellis
0

Super-Familie nicht unterstützt sekundären index, aber regelmäßige Kolumne Familie tun. Die Verwendung sekundärer index, den Sie verwenden können, die GetWhere-Anweisung.

Hier ist ein Beispiel, genommen von einem meiner PHP-Projekte:
```
public function GetCodeWithValue( $_value )
{
    $result = $this->getDbFamily()->getWhere(array('value' => $_value, 'used' => 0));

    if ( $this->IsValid( $result ))
        return $result->key();
    else 
        return null;
}
```
Diesen code verwenden Sie diese Cassandra API : https://github.com/kallaspriit/Cassandra-PHP-Client-Libraryf

InformationsquelleAutor Stephane Brillant
0

Beachten Sie, dass seit die Frage gestellt wurde, Cassandra Unterstützung für die Indizes automatisch verwaltet durch die Cassandra-system (ich glaube seit 0.8). Beantworten kann die Frage für einige Leute zu verwalten, sondern Ihren eigenen index.

http://www.datastax.com/docs/1.1/dml/using_cli#indexing-a-column

Diesem wird gesagt, ich wollte auch erwähnt, dass eine SQL-Datenbank, bei der es erstellt einen index, der Duplikate eine Menge von Daten zu generieren, sagte index. Es ist wirklich noch Billig, im Cassandra-vor allem, weil Sie lieb zu optimieren. Das Hauptproblem ist, dass Sie haben zu halten, die Kohärenz manuell die SQL stellt für Sie transparent. Aber beide Mechanismen verwenden Sie genau die gleichen theoretischen Konzept.

Dies ist ein bisschen wie die re-Programmierung Ihrer eigenen std::string mit Spezialisierungen, die beziehen sich auf Ihre Bewerbung... (man denke an die QString-und CString-zum Beispiel!)

InformationsquelleAutor Alexis Wilke

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.