Tag: data-partitioning

Daten-Partitionierung beschäftigt sich mit der Aufteilung einer Sammlung von Daten in kleinere Sammlungen von Daten zum Zweck der schnelleren Verarbeitung, einfacher Statistiken sammeln und kleineren Speicher – /Persistenz-Bilanz.

Wie partition einer Menge von Werten (Vektor) in R

Anzahl der Antworten 3 Antworten
Ich bin Programmierung in R. ich habe einen Vektor mit, sagen wir mal, 1000 Werte. Jetzt sagen wir, ich will auf partition diese 1000 Werte nach dem Zufallsprinzip in zwei neuen sets, eines mit 400-Werte und die

Verständnis eines median-Algorithmus Auswahl?

Anzahl der Antworten 1 Antworten
Ich bin derzeit lernen algorithmen in meiner Freizeit, aber habe folgende Frage während des Studiums Kapitel 3 wählen Sie () - algorithmen. Ich verstehe, dass ich kann verwenden Sie die select () - Algorithmus zu finden, der

Oracle-Partition-ID und subpartition by DATE mit Intervall

Anzahl der Antworten 1 Antworten
Schema an dem ich arbeite hat eine kleine Menge von Kunden, mit vielen Daten pro Kunde. In der Bestimmung eines Partitionierungs-Strategie, war mein Erster Gedanke, partition by customer_id und dann subpartition by range mit einem Tages-Intervall. Sie

Erstellen der Daten-partition in R

Anzahl der Antworten 2 Antworten
Mit caret - Paket bei der Erstellung der Daten-partition zu 75% training und 25% test verwenden wir: inTrain<- createDataPartition(y=spam$type,p=0.75, list=FALSE) Hinweis: dataset namens spam - und target-variable namens type Meine Frage ist, was ist der Zweck, einschließlich

Wie viele verschiedene Partitionen mit genau n Teile kann man aus einer Menge mit k Elementen?

Anzahl der Antworten 2 Antworten
Wie viele verschiedene Partitionen mit genau zwei Teile können aus der Menge {1,2,3,4}? Es gibt 4 Elemente in dieser Liste, müssen partitioniert in 2 Teile. Ich schrieb diese heraus und bekam insgesamt 7 verschiedene Möglichkeiten: {{1},{2,3,4}} {{2},{1,3,4}}

Wie funktioniert createDataPartition Funktion aus caret-Paket aufteilen der Daten?

Anzahl der Antworten 1 Antworten
Aus der Dokumentation: Für die bootstrap-Stichproben, zufallsstichproben verwendet. Für die anderen Daten aufteilen, die Stichprobenziehung erfolgt innerhalb der Stufen von y wenn y ist ein Faktor in einem Versuch, um die balance der Klasse Verteilungen innerhalb die

Spark SQL - Unterschied zwischen df.partitionieren und DataFrameWriter partitionBy?

Anzahl der Antworten 2 Antworten
Was ist der Unterschied zwischen DataFrame repartition() und DataFrameWriter partitionBy() Methoden? Ich hoffe, beide werden benutzt, um "partition Daten basierend auf dataframe Spalte"? Oder gibt es da einen Unterschied? InformationsquelleAutor Shankar | 2016-11-04

QuickSort und Hoare-Partition

Anzahl der Antworten 7 Antworten
Ich habe eine harte Zeit zu übersetzen QuickSort mit Hoare-Partitionierung in C-code, und kann nicht herausfinden, warum. Der code, den ich verwende, ist unten gezeigt: void QuickSort(int a,int start,int end) { int q=HoarePartition(a,start,end); if (end<=start) return; QuickSort(a,q+1,end);

Abfragen von Windows Azure Table Storage mit mehreren Abfragekriterien

Anzahl der Antworten 2 Antworten
Ich versuche, die Abfrage einer Tabelle im Windows Azure-Speicher, und wurde zunächst unter Verwendung der TableQuery.CombineFilters im TableQuery<RecordEntity>().Where - Funktion wie folgt: TableQuery.CombineFilters( TableQuery.GenerateFilterCondition("PartitionKey", QueryComparisons.GreaterThanOrEqual, lowDate), TableOperators.And, TableQuery.GenerateFilterCondition("PartitionKey", QueryComparisons.LessThanOrEqual, lowDate), TableQuery.GenerateFilterCondition("PartitionKey", QueryComparisons.Equal, entityId) )); Leider CombineFilters erlaubt

C # - elegante Möglichkeit, eine Liste zu partitionieren?

Anzahl der Antworten 11 Antworten
Ich würde gerne partition eine Liste in eine Liste von Listen, indem Sie die Anzahl der Elemente in jeder partition. Angenommen, ich habe die Liste {1, 2, ... 11}, und würde gerne partition ist es so, dass

Python-Äquivalent von filter () erhält zwei Ausgabelisten (d. h. Partition einer Liste)

Anzahl der Antworten 10 Antworten
Sagen wir, ich habe eine Liste, und eine Filterfunktion. Mit so etwas wie >>> filter(lambda x: x > 10, [1,4,12,7,42]) [12, 42] Ich kann die Elemente, die das matching-Kriterium. Gibt es eine Funktion, die ich verwenden könnte,