Die Verwendung von kategorischen Daten als features in sklean LogisticRegression

Ich versuche zu verstehen, wie die Verwendung von kategorischen Daten als features in sklearn.linear_model's LogisticRegression.

Verstehe ich natürlich, die ich brauche, um zu verschlüsseln.

  1. Was ich nicht verstehe, ist, wie pass die codierte Funktion der Logistischen regression also ist es verarbeitet, wie ein kategorisches Merkmal, und nicht die Interpretation der int-Wert es wurde bei der Kodierung als standard-messbaren Funktion.

  2. (Weniger wichtig) Kann jemand erklären den Unterschied zwischen der Verwendung preprocessing.LabelEncoder(), DictVectorizer.vocabulary oder nur die Codierung der kategorialen Daten selbst mit einem einfachen dict? Alex A. Kommentar hier berührt das Thema aber nicht sehr tief.

Besonders mit dem ersten!

InformationsquelleAutor Optimesh | 2015-11-28
Schreibe einen Kommentar