Was bedeutet KFold in python genau tun?

Ich freue mich auf dieses tutorial: https://www.dataquest.io/mission/74/getting-started-with-kaggle

Hab ich Teil 9, Vorhersagen. Dort gibt es einige Daten in einem dataframe namens titanic, das ist dann aufgeteilt in Falten Verwendung:

# Generate cross validation folds for the titanic dataset.  It return the row indices corresponding to train and test.
# We set random_state to ensure we get the same splits every time we run this.
kf = KFold(titanic.shape[0], n_folds=3, random_state=1)

Ich bin mir nicht sicher, was es genau macht und welche Art von Objekt kf ist. Ich habe versucht, die Dokumentation Lesen, aber es hat nicht viel geholfen. Außerdem gibt es drei Falten (n_folds=3), warum ist es später nur Zugriff auf Schulen und zu testen (und wie ich weiß, Sie sind aufgerufen, trainieren und testen) in dieser Zeile?

for train, test in kf:

InformationsquelleAutor user | 2016-03-17

Schreibe einen Kommentar