Tag: data-partitioning
Daten-Partitionierung beschäftigt sich mit der Aufteilung einer Sammlung von Daten in kleinere Sammlungen von Daten zum Zweck der schnelleren Verarbeitung, einfacher Statistiken sammeln und kleineren Speicher – /Persistenz-Bilanz.
3
Antworten
Ich bin Programmierung in R. ich habe einen Vektor mit, sagen wir mal, 1000 Werte. Jetzt sagen wir, ich will auf partition diese 1000 Werte nach dem Zufallsprinzip in zwei neuen sets, eines mit 400-Werte und die
1
Antworten
Ich bin derzeit lernen algorithmen in meiner Freizeit, aber habe folgende Frage während des Studiums Kapitel 3 wählen Sie () - algorithmen. Ich verstehe, dass ich kann verwenden Sie die select () - Algorithmus zu finden, der
1
Antworten
Schema an dem ich arbeite hat eine kleine Menge von Kunden, mit vielen Daten pro Kunde. In der Bestimmung eines Partitionierungs-Strategie, war mein Erster Gedanke, partition by customer_id und dann subpartition by range mit einem Tages-Intervall. Sie
2
Antworten
Mit caret - Paket bei der Erstellung der Daten-partition zu 75% training und 25% test verwenden wir: inTrain<- createDataPartition(y=spam$type,p=0.75, list=FALSE) Hinweis: dataset namens spam - und target-variable namens type Meine Frage ist, was ist der Zweck, einschließlich
2
Antworten
Wie viele verschiedene Partitionen mit genau zwei Teile können aus der Menge {1,2,3,4}? Es gibt 4 Elemente in dieser Liste, müssen partitioniert in 2 Teile. Ich schrieb diese heraus und bekam insgesamt 7 verschiedene Möglichkeiten: {{1},{2,3,4}} {{2},{1,3,4}}
1
Antworten
Aus der Dokumentation: Für die bootstrap-Stichproben, zufallsstichproben verwendet. Für die anderen Daten aufteilen, die Stichprobenziehung erfolgt innerhalb der Stufen von y wenn y ist ein Faktor in einem Versuch, um die balance der Klasse Verteilungen innerhalb die
2
Antworten
Was ist der Unterschied zwischen DataFrame repartition() und DataFrameWriter partitionBy() Methoden? Ich hoffe, beide werden benutzt, um "partition Daten basierend auf dataframe Spalte"? Oder gibt es da einen Unterschied? InformationsquelleAutor Shankar | 2016-11-04
7
Antworten
Ich habe eine harte Zeit zu übersetzen QuickSort mit Hoare-Partitionierung in C-code, und kann nicht herausfinden, warum. Der code, den ich verwende, ist unten gezeigt: void QuickSort(int a,int start,int end) { int q=HoarePartition(a,start,end); if (end<=start) return; QuickSort(a,q+1,end);
2
Antworten
Ich versuche, die Abfrage einer Tabelle im Windows Azure-Speicher, und wurde zunächst unter Verwendung der TableQuery.CombineFilters im TableQuery<RecordEntity>().Where - Funktion wie folgt: TableQuery.CombineFilters( TableQuery.GenerateFilterCondition("PartitionKey", QueryComparisons.GreaterThanOrEqual, lowDate), TableOperators.And, TableQuery.GenerateFilterCondition("PartitionKey", QueryComparisons.LessThanOrEqual, lowDate), TableQuery.GenerateFilterCondition("PartitionKey", QueryComparisons.Equal, entityId) )); Leider CombineFilters erlaubt
11
Antworten
Ich würde gerne partition eine Liste in eine Liste von Listen, indem Sie die Anzahl der Elemente in jeder partition. Angenommen, ich habe die Liste {1, 2, ... 11}, und würde gerne partition ist es so, dass
10
Antworten
Sagen wir, ich habe eine Liste, und eine Filterfunktion. Mit so etwas wie >>> filter(lambda x: x > 10, [1,4,12,7,42]) [12, 42] Ich kann die Elemente, die das matching-Kriterium. Gibt es eine Funktion, die ich verwenden könnte,