Wie zufällig Stichprobe aus einer Scala-Liste oder ein array?

Möchte ich zufällig Probe aus einer Scala-Liste oder ein array (keine RDD), die Größe der Stichprobe kann wesentlich länger sein als die Länge der Liste oder ein array, wie kann ich dies tun effizient? Da die Größe der Stichprobe sehr groß sein kann und die Probenahme (auf anderen Listen/arrays) getan werden muss, um eine große Anzahl von Zeiten.

Ich weiß, für eine Spark-RDD wir können takeSample (), um es zu tun, gibt es ein äquivalent für Scala Liste/array?

Danke Ihnen sehr.

  • Zufallszahlengeneratoren sind stateful, so dass es nicht sinnvoll ist, für die Listen haben eine solche Funktion. Sie würden umsetzen müssen Sie selbst (es wäre auch eine lineare operation). Für arrays kann man eine zufällige Zahl aus der "Zufällige" Objekte, etwa so: 'Random.nextInt(myArray.Länge)' und den index in das array.
  • AH, nvm. Ich lese zu schnell xD
InformationsquelleAutor Carter | 2015-10-04
Schreibe einen Kommentar