Beispiel zufällige Zeilen innerhalb jeder Gruppe in einer Daten.Tabelle

Wie würden Sie die Daten verwenden.Tabelle effizient nehmen Sie eine Probe von Zeilen innerhalb jeder Gruppe in einen Daten-frame?

DT = data.table(a = sample(1:2), b = sample(1:1000,20))
DT
    a   b
 1: 2 562
 2: 1 183
 3: 2 180
 4: 1 874
 5: 2 533
 6: 1  21
 7: 2  57
 8: 1  20
 9: 2  39
10: 1 948
11: 2 799
12: 1 893
13: 2 993
14: 1  69
15: 2 906
16: 1 347
17: 2 969
18: 1 130
19: 2 118
20: 1 732

Ich dachte an etwas wie: DT[ , sample(??, 3), by = a] zurückgeben würde eine Probe von drei Zeilen für jedes "a" (die Reihenfolge der zurückgegebenen Zeilen ist nicht signifikant):

    a   b
 1: 2 180
 2: 2  57
 3: 2 799
 4: 1  69
 5: 1 347
 6: 1 732
Schreibe einen Kommentar