Wenn die Skalierung der Daten, warum der Zug dataset verwenden Sie 'passen' und 'transformieren', aber das test-dataset verwenden Sie nur 'verwandeln'?

Wenn die Skalierung der Daten, warum der Zug dataset verwenden Sie 'passen' und 'transformieren', aber das test-dataset verwenden Sie nur 'verwandeln'?

SAMPLE_COUNT = 5000
TEST_COUNT = 20000
seed(0)
sample = list()
test_sample = list()
for index, line in enumerate(open('covtype.data','rb')):
    if index < SAMPLE_COUNT:
        sample.append(line)
    else:
        r = randint(0,index)
        if r < SAMPLE_COUNT:
            sample[r] = line
        else:
            k = randint(0,index)
            if k < TEST_COUNT:
                if len(test_sample) < TEST_COUNT:
                    test_sample.append(line)
                else:
                    test_sample[k] = line
from sklearn.preprocessing import StandardScaler
for n, line in enumerate(sample):
sample[n] = map(float, line.strip().split(','))
y = np.array(sample)[:,-1]
scaling = StandardScaler()

X = scaling.fit_transform(np.array(sample)[:,:-1]) ##here use fit and transform

for n,line in enumerate(test_sample):
test_sample[n] = map(float,line.strip().split(','))
yt = np.array(test_sample)[:,-1]

Xt = scaling.transform(np.array(test_sample)[:,:-1])##why here only use transform

Wie die Anmerkung sagt, warum Xt verwenden Sie nur transformieren, aber keine passt?

InformationsquelleAutor littlely | 2017-04-28
Schreibe einen Kommentar