Tag: partitioning

Partitionierung ist ein performance-Strategie, wobei Sie teilen möglicherweise sehr große Gruppen von Daten in eine Anzahl von kleineren Gruppen von Daten.

Welcher Teil des CAP-theorem hat Cassandra Opfer und warum?

Anzahl der Antworten 2 Antworten
Es ist ein große reden hier über die Simulation von partition Fragen in Cassandra mit Kingsby ist Jesper Bibliothek. Meine Frage ist - mit Cassandra sind Sie vor allem mit der Partitionierung Teil der CAP-theorem, oder ist

Wie man die Anzahl der Elemente in der partition?

Anzahl der Antworten 3 Antworten
Gibt es eine Möglichkeit, um die Anzahl der Elemente in einem spark-RDD-partition, da die partition-ID? Ohne das Scannen der gesamte partition. Etwas wie dieses: Rdd.partitions().get(index).size() Außer ich sehe nicht, wie eine API für die Funke. Irgendwelche Ideen?

Effiziente Abfrage von multi-partition Postgres-Tabelle

Anzahl der Antworten 3 Antworten
Ich habe gerade umstrukturiert, meine Datenbank zu verwenden partitionieren in Postgres 8.2. Nun habe ich ein problem mit der query-performance: SELECT * FROM my_table WHERE time_stamp >= '2010-02-10' and time_stamp < '2010-02-11' ORDER BY id DESC LIMIT

Was ist der beste Weg zur Partitionierung werden große Tabellen in SQL-Server?

Anzahl der Antworten 6 Antworten
In einem aktuellen Projekt der "lead" - Entwickler entwickelt ein Datenbank-schema, in dem "größere" Tabellen aufgeteilt werden auf zwei getrennte Datenbanken, die mit Blick auf die Haupt-Datenbank, die union würde die zwei separaten Datenbank-Tabellen zusammen. Die Hauptdatenbank

Java-8-partition Liste

Anzahl der Antworten 2 Antworten
Ist es möglich, die partition eine Liste, in der reinen Jdk8 in gleich große Stücke (Teillisten). Ich weiß, dass es möglich ist, mit Guave Listen Klasse, aber können wir tun es mit pure Jdk? Ich will nicht,

Cross-Validierung für das glm() Modelle

Anzahl der Antworten 2 Antworten
Ich versuche zu tun, eine 10-fold-cross-validation für einige glm-Modelle, die ich gebaut habe früher in R. ich bin ein wenig verwirrt über die cv.glm() Funktion in der boot Paket, obwohl ich gelesen habe, viel Hilfe-Dateien. Wenn ich

Undo-Table-Partitioning

Anzahl der Antworten 2 Antworten
Ich habe eine Tabelle " X " und habe die folgenden CREATE PARTITION FUNCTION PV1(INT) ALS RANGE-LINKS FÜR WERTE (1, 2, 3, 4) CREATE PARTITION SCHEME PS1 ALS PARTITION PV1 ALLE ZU ([PRIMARY]) CREATE CLUSTERED INDEX CIDX_X

Wie zu partitionieren und zu schreiben DataFrame in Funken, ohne das löschen von Partitionen, ohne dass neue Daten?

Anzahl der Antworten 2 Antworten
Ich versuche zu sparen DataFrame auf HDFS in Parkett-format mit DataFrameWriter, aufgeteilt durch drei Spalte mit Werten wie diesen: dataFrame.write.mode(SaveMode.Overwrite).partitionBy("eventdate", "hour", "processtime").parquet(path) Wie bereits in diese Frage, partitionBy wird, löschen Sie die vollständigen bestehende Hierarchie von Partitionen

mysql-Datenbank automatische Partitionierung

Anzahl der Antworten 3 Antworten
Ich habe eine mysql Datenbank-Tabelle, ich möchte die partition von Datum, vor allem durch Monat & Jahr. Jedoch, wenn neue Daten Hinzugefügt, für einen neuen Monat, ich will nicht zu müssen, um manuell aktualisieren Sie die Datenbank.

Partitionierung von Daten in r basiert auf mehreren Klassen von Beobachtungen

Anzahl der Antworten 4 Antworten
Ich versuche, die partition Daten, die ich in R, 2/3 zum training und 1/3 zum testen. Ich habe eine Kategorie, variable und sieben numerischen Variablen. Jede Beobachtung ist klassifiziert als entweder A, B, C, oder D. Einfachheitshalber

Wie sehen Tabelle die Größe der partition in MySQL ( ist es überhaupt möglich? )

Anzahl der Antworten 2 Antworten
Habe ich partitionierte meine Tabelle horizontal und ich würde gerne sehen, wie die Zeilen, die derzeit verteilt sind. Die Suche im Internet nicht bringen keine relevanten Ergebnisse. Könnte mir jemand sagen ob dies möglich ist? InformationsquelleAutor der

Füllen Sie eine Festplatte mit einer ext4-partition in einem Skript

Anzahl der Antworten 3 Antworten
Wollte ich mit parted für scripted partitionning etwa so : parted -a optimal /dev/sda mklabel gpt mkpart primary ext4 1 -1 Aber es beschwert sich über die -1 nicht als eine anerkannte option. Immer noch die gleiche

Tabelle Partitionierung mit 2 Spalten

Anzahl der Antworten 3 Antworten
Ist es möglich, die partition einer Tabelle mit 2 Spalten statt nur 1 für die partition Funktion? Betrachten Sie eine Tabelle mit 3 Spalten ID (int, primary key Datum (datetime), Num (int) Möchte ich diese partition Tabelle

Wie funktioniert das partitionieren der Arbeit in der Funke?

Anzahl der Antworten 1 Antworten
Ich versuche zu verstehen, wie die Partitionierung in Apache Spark. Könnt Ihr bitte helfen? Hier ist das Szenario: ein master-und zwei-Knoten mit 1 Kern jeder eine Datei count.txt von einer Größe von 10 MB Wie viele Partitionen

Kafka: Ist Zoowärter ein Muss?

Anzahl der Antworten 5 Antworten
In Kafka, ich möchte nur eine einzige broker, einziges Thema und eine einzige partition mit einem Erzeuger und mehrere Verbraucher (jeder Verbraucher erhält seine eigene Kopie der Daten, die vom broker). Angesichts dieser, ich will nicht den

Wie funktioniert HashPartitioner?

Anzahl der Antworten 3 Antworten
Lese ich bis auf die Dokumentation der HashPartitioner. Leider nichts wurde viel erklärt, außer für die API-Aufrufe. Ich bin unter der Annahme, dass HashPartitioner Partitionen verteilt, basierend auf dem Hashwert des keys. Zum Beispiel, wenn meine Daten

Was ist MYSQL-Partitionierung?

Anzahl der Antworten 1 Antworten
Ich habe die Dokumentation gelesen (http://dev.mysql.com/doc/refman/5.1/en/partitioning.html), aber ich würde gerne in Ihren eigenen Worten, was es ist und warum es verwendet wird. Ist es vor allem verwendet für mehrere Server, so dass es nicht ziehen Sie nach

Auto-sharding postgresql?

Anzahl der Antworten 5 Antworten
Ich habe ein problem, wo ich brauche, zu laden, eine Menge von Daten (5+ Milliarden Zeilen) in eine Datenbank sehr schnell (im Idealfall weniger als eine 30 min aber schneller ist besser), und ich war vor kurzem

Wie definiere ich Partitionierung von DataFrame?

Anzahl der Antworten 5 Antworten
Habe ich angefangen mit Spark SQL und DataFrames in Spark 1.4.0. Ich bin zu wollen, um eine benutzerdefinierte Partitionierer auf DataFrames, in der Scala, aber nicht zu sehen, wie dies zu tun. Einem der Daten-Tabellen arbeite ich

Wie partitioniere ich Mysql über mehrere Server?

Anzahl der Antworten 3 Antworten
Ich weiß, dass horizontale Partitionierung...können Sie viele Tabellen. Wie können Sie dies tun, mit mehreren Servern? Dies ermöglicht Mysql skalieren. Erstellen X Tabellen auf X-Servern? Wer darauf zu erklären, oder eine gute Anfänger-tutorial (Schritt für Schritt), die

Effiziente Möglichkeit, eine Liste in Listen der Größe n zu unterteilen

Anzahl der Antworten 11 Antworten
Ich habe ein array, das ich möchte teilen sich in kleinere arrays von n-Größe, und führen Sie eine operation auf jeden. Meine aktuelle Methode, dies zu tun ist umgesetzt mit ArrayLists in Java (irgendein pseudocode) for (int

Tabelle mit 80 Millionen Datensätzen und Hinzufügen eines Index dauert mehr als 18 Stunden (oder für immer)! Was jetzt?

Anzahl der Antworten 5 Antworten
Einen kurzen Rückblick, was passiert ist. Ich arbeite mit 71 Millionen Datensätze (nicht viel im Vergleich zu Milliarden von Datensätzen von anderen verarbeiteten). Auf einem anderen threadschlug jemand vor, dass das aktuelle setup der cluster ist nicht

Was ist Tabellenpartitionierung?

Anzahl der Antworten 5 Antworten
In diesem Fall sollten wir die Verwendung von Tabellen-Partitionierung? InformationsquelleAutor der Frage P Sharma | 2009-11-30

Wie kann man die dynamische Programmierlösung in der linearen Partitionierung verstehen?

Anzahl der Antworten 2 Antworten
Ich bin kämpfen, um zu verstehen, die dynamische Programmierung Lösung der linearen Partitionierung problem. Ich lese das Die Algorithmus-Design-Handbuch und das problem ist beschrieben im Abschnitt 8.5. Ich habe den Teil Lesen, der unzählige Male, aber ich

Was ist ein guter Weg zum horizontalen Shard in Postgresql

Anzahl der Antworten 4 Antworten
was ist ein guter Weg, um den horizontalen Splitter in postgresql 1. pgpool 2 2. gridsql was eine bessere Art und Weise zu verwenden, Splitter außerdem ist es möglich, paritition ohne änderung der client-code Wäre es toll,

MySQL Partitioning / Sharding / Splitting - welcher Weg?

Anzahl der Antworten 9 Antworten
Haben wir eine InnoDB-Datenbank, die ist über 70 GB, und wir erwarten, dass es zu wachsen, um mehrere hundert GB in den nächsten 2 bis 3 Jahren. Über 60 % der Daten gehören zu einer einzigen Tabelle.