Stichprobe einer Teilmenge einer dataframe in Pandas
Sagen, ich habe einen dataframe mit 100.000 Einträge und möchten es aufgeteilt in 100 Abschnitte von 1000 Einträgen.
Wie nehme ich eine zufällige Stichprobe von sagen Größe 50 nur eine der 100 Abschnitte. das Daten-set ist bereits bestellt, so dass die ersten 1000 Ergebnisse sind der erste Abschnitt den nächsten Abschnitt, das nächste und so weiter.
vielen Dank
df.iloc[np.random.randint(1,1000,50),:]
.df1
ist eine der über 100 Sektionen.
Du musst angemeldet sein, um einen Kommentar abzugeben.
Können Sie die
Beispiel
- Methode*:*Auf einem Abschnitt DataFrames.
Hinweis: Wenn Sie eine größere sample-Größe, die der Größe der DataFrame das wird ein Fehler ausgelöst, es sei denn, Sie Beispiel mit Ersatz.
replace
tun? die Dokumentation ist mir nicht klar. Danke!!!Eine Lösung ist die Verwendung der
choice
Funktion numpy.Sagen, Sie wollen 50 Einträge von 100, die Sie verwenden können:
Dies ist natürlich nicht in Anbetracht Ihrer block-Struktur. Wenn Sie möchten, eine 50-Element-Beispiel von block
i
zum Beispiel, können Sie tun:Dies ist ein schöner Ort für Rekursion.
output: [6, 0, 7, 1, 3, 5, 4, 2]