Sklearn SVM: SVR und SVC, immer die gleiche Vorhersage für jeden Eingang.

Hier ist ein einfügen der code: SVM-sample-code

Ich habe ein paar von den anderen Antworten auf dieses problem...und es scheint, wie diese bestimmte iteration das problem ist ein bisschen anders.

First off, meine Eingänge sind normalisiert, und ich habe fünf Eingängen pro Punkt. Die Werte sind alle ziemlich große (gesunde 0,5 s und 0,7 s etc-paar in der Nähe von null oder nahe 1 zahlen).

Habe ich etwa 70 x Eingänge entsprechend Ihrer 70 y-Eingänge ein. Die y-Eingänge sind ebenfalls normalisiert (Sie sind prozentuale Veränderungen der Funktion nach jedem Zeit-Schritt).

Initialisiere ich meine SVR (und SVC), Sie zu trainieren, und dann testen Sie mit 30 out-of-sample-Eingänge...und die genau die gleiche Vorhersage für jeden Eingang (und die Eingaben ändern, indem Sie angemessene Mengen--0.3, 0.6, 0.5, etc.). Ich würde denken, daß der Sichter (mindestens) hätte eine Differenzierung...

Hier ist der code den ich habe:

# train svr

my_svr = svm.SVR()
my_svr.fit(x_training,y_trainr)

# train svc

my_svc = svm.SVC()
my_svc.fit(x_training,y_trainc)


# predict regression

p_regression = my_svr.predict(x_test)
p_r_series = pd.Series(index=y_testing.index,data=p_regression)

# predict classification

p_classification = my_svc.predict(x_test)
p_c_series = pd.Series(index=y_testing_classification.index,data=p_classification)

Und hier sind Beispiele meiner Eingänge:

x_training = [[  1.52068627e-04   8.66880301e-01   5.08504362e-01   9.48082047e-01
7.01156322e-01],
              [  6.68130520e-01   9.07506250e-01   5.07182647e-01   8.11290634e-01
6.67756208e-01],
              ... x 70 ]

y_trainr = [-0.00723209 -0.01788079  0.00741741 -0.00200805 -0.00737761  0.00202704 ...]

y_trainc = [ 0.  0.  1.  0.  0.  1.  1.  0. ...]

Und die x_test matrix (5x30) ist ähnlich wie die x_training matrix in Bezug auf die Größenordnung und Varianz der Eingänge...dasselbe für y_testr und y_testc.

Derzeit, die Prognosen für alle tests sind genau die gleichen (0.00596 für die regression, und 1 für die Einstufung...)

Wie bekomme ich den SVR und SVC-Funktionen ausspucken relevanten Vorhersagen? Oder zumindest verschiedene Prognosen auf der Grundlage der Eingänge...

Zumindest, die classifier in der Lage sein sollten, Entscheidungen zu treffen. Ich meine, auch wenn ich noch nicht genug Maße für die regression...

Sie müssen eine eigenständige, ausführbare Beispiel mit Beispiel-Daten, die eigentlich das problem veranschaulicht.
Okay. Eine Sekunde (oder etwa 10 min =)
gibt es einen link zu einem pastebin code. Ich habe die kompletten Daten...
würden Sie mir helfen, mit dieser Liebe? stackoverflow.com/questions/40357805/...

InformationsquelleAutor donlan | 2015-12-26

9

Versuchen, die Steigerung Ihrer C aus dem Standard. Es scheint, Sie sind underfitting.
```
my_svc = svm.SVC(probability=True, C=1000)
my_svc.fit(x_training,y_trainc)

p_classification = my_svc.predict(x_test)
```
p_classification wird dann:
```
array([ 1.,  0.,  1.,  0.,  1.,  1.,  1.,  1.,  1.,  1.,  0.,  0.,  0.,
        1.,  0.,  0.,  0.,  0.,  0.,  1.,  1.,  0.,  1.,  1.,  1.,  1.,
        1.,  1.,  1.,  1.])
```
Für die SVR Fall, dass Sie wollen auch reduzieren Sie Ihre epsilon.
```
my_svr = svm.SVR(C=1000, epsilon=0.0001)
my_svr.fit(x_training,y_trainr)

p_regression = my_svr.predict(x_test)
```
p_regression wird dann:
```
array([-0.00430622,  0.00022762,  0.00595002, -0.02037147, -0.0003767 ,
        0.00212401,  0.00018503, -0.00245148, -0.00109994, -0.00728342,
       -0.00603862, -0.00321413, -0.00922082, -0.00129351,  0.00086844,
        0.00380351, -0.0209799 ,  0.00495681,  0.0070937 ,  0.00525708,
       -0.00777854,  0.00346639,  0.0070703 , -0.00082952,  0.00246366,
        0.03007465,  0.01172834,  0.0135077 ,  0.00883518,  0.00399232])
```
Sollten Sie schauen, um tunen Sie Ihr C-parameter unter Verwendung der Kreuzvalidierung, so dass es in der Lage ist, um beste Leistung, auf welche Metrik wichtigste für Sie. Möchten Sie vielleicht Blick auf GridSearchCV zu helfen, Sie dies tun.
- Ok...Super, vielen Dank--hab die Klassifizierung arbeiten. Der SVR ist immer noch handeln...Aber wie es aussieht bin ich nicht etwas falsch zu machen, so sollte dies setzte mich auf die richtige Spur. Glaubst du, scipy minimieren, wird den trick tun? Jedenfalls, wissen Sie, PCA? Wird ausgeführt, dass sich die situation verbessern? (Ich denke, ich müsste doppelt so viel Trainingsdaten obwohl...das könnte mich drängen, mich wieder zu weit in der Zeit...)
- Gerade Hinzugefügt eine Bearbeiten für den SVR Fall. PCA wird wahrscheinlich nicht helfen, Sie. Versuchen Sie zuerst tuning-Parameter mit GridSearchCV, dann können Sie entscheiden, ob Sie weitere Daten benötigen.
- Eigentlich ein guter Weg, um zu sehen, ob mehr Daten wird helfen, ist die Handlung eine Lernkurve, wo Sie variieren die Menge an Daten, und Messen, Schulungs-und CV-Verlust.
- Ok, Super, danke
- Oh. Auch da sind Sie durch ein kernel, möchten Sie vielleicht auch zu Stimmen gamma. Dieser Effekt kann ziemlich dramatisch.
- Schön...danke..das hilft viel
InformationsquelleAutor David Maust
3

Ich hatte das gleiche Problem, aber eine völlig andere Ursache, und daher einen völlig anderen Ort, eine Lösung zu suchen.

Wenn Ihre Vorhersage Eingänge sind falsch skaliert aus irgendeinem Grund, Sie können dieselben Symptome auftreten, finden Sie hier. Dies könnte zu vergessen (oder fehlcodierung) die Skalierung der Eingabewerte in einer späteren Vorhersage, oder aufgrund der Eingaben in der falschen Reihenfolge.

InformationsquelleAutor James Nowell
0

In meinem Fall musste ich skalieren meiner Daten mit der StandardScaler in der sklearn Paket.

Außerdem musste ich skalieren die einzelnen Funktionen unabhängig voneinander in meinem Fall zwei Arten von Entfernungen jedes einzeln skaliert.
```
from sklearn.preprocessing import StandardScaler
ss = StandardScaler()
ss.fit(X[:,0:10])
X[:,0:10] = ss.transform(X[:,0:10])
ss = StandardScaler()
ss.fit(X[:,10:20])
X[:,10:20] = ss.transform(X[:,10:20])
```
InformationsquelleAutor John

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.