Sklearn versuchen, zu konvertieren string-Liste zu schwimmt

Ich versuche, eine sklearn.svm.SVC(kernel="linear") - Algorithmus arbeiten. Mein X ist ein array gemacht mit [misc.imread(each).flatten() for each in filenames] und meine y2 ist ein Teil einer Liste aus strings wie ["A","1","4","F"..].

Wenn ich versuche clf.fit(X,y2), sklearn versucht meine konvertieren string-Liste in den Wagen und schlägt fehl, werfen ValueError: could not convert string to float. Wie kann ich dieses Problem lösen?

EDIT: Upgrade sklearn 0,15 das problem gelöst.

InformationsquelleAutor sikerbela | 2015-01-19

10

Gibt es eine helper-Klasse in scikit-learn, die sich um diese schön, es heißt sklearn.preprocessing.LabelEncoder:
```
from sklearn.preprocessing import LabelEncoder
y2 = ["A","1","4","F","A","1","4","F"]
lb = LabelEncoder()
y = lb.fit_transform(y2)
# y is now: array([2, 0, 1, 3, 2, 0, 1, 3])
```
Um zurück zu Ihrem ursprünglichen labels (z.B. nach der Klassifizierung ungesehenen Daten mit SVC), verwenden Sie das inverse_transform von LabelEncoder zur Wiederherstellung der string Etiketten:
```
lb.inverse_transform(y)
# => array(['A', '1', '4', 'F', 'A', '1', '4', 'F'], dtype='|S1')
```
- Das Problem scheint zu sein, über die version von sklearn. Es wirft den Fehler in 0.11 und LabelEncoder ist nicht in dieser version. Upgrade sklearn 0.15, löste das problem ohne code Hinzugefügt.
- Ja, 0.11, ist ziemlich veraltet, benötigen Sie mindestens 0.12, wenn nicht von 0,13 denke ich, noch nicht verifiziert, obwohl es...
InformationsquelleAutor Matt
3

Weisen Sie eine eindeutige ganze Zahl, um jede eindeutige Zeichenfolge label. Ich gehe davon aus, dass Ihre y2 variable enthält mehrere Instanzen jeder Klasse.

Also vielleicht sieht es mehr wie:
```
y2 = ["A","1","4","F","A","1","4","F"]
```
Nun, Sie könnten etwas tun wie:
```
S = set(y2) # collect unique label names
D = dict( zip(S, range(len(S))) ) # assign each string an integer, and put it in a dict
Y = [D[y2_] for y2_ in y2] # store class labels as ints
```
Für y2 oben, so ergibt sich:
```
>>> print Y
[0, 1, 2, 3, 0, 1, 2, 3]
```
- Jetzt funktioniert es. Ich war darüber nachzudenken, aber ich konnte nicht schreiben Sie diese einfach. Danke für die Hilfe
InformationsquelleAutor Matt Hancock

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.