Tag: dummy-variable

Dummy-oder Indikator-Variablen werden verwendet, um kategoriale oder qualitative Variablen oder Faktoren in einem Regressionsmodell in R-Programmiersprache für statistisches computing, Bioinformatik und Grafiken.

Dummy-Variablen, wenn nicht alle Kategorien vorhanden sind

Anzahl der Antworten 7 Antworten
Habe ich eine Reihe von dataframes, wo eine der Spalten enthält einen kategorischen Variablen. Ich möchte konvertieren, um mehrere dummy-Variablen, in dem Fall würde ich normalerweise verwenden get_dummies. Was passiert, ist, dass get_dummies schaut auf die Daten,

Panda get_dummies vs. Sklearn ist OneHotEncoder() :: Was sind die vor-und Nachteile?

Anzahl der Antworten 2 Antworten
Lerne ich verschiedene Methoden zur Umwandlung von kategorischen Variablen zu Numerik für machine-learning Classifier. Ich kam über die pd.get_dummies Methode und sklearn.preprocessing.OneHotEncoder() und ich wollte sehen, wie Sie unterschieden sich in Bezug auf Leistung und Verwendung. Fand

Pandas: Holen Dummies

Anzahl der Antworten 1 Antworten
Habe ich Folgendes dataframe: amount catcode cid cycle date di feccandid type 0 1000 E1600 N00029285 2014 2014-05-15 D H8TX22107 24K 1 5000 G4600 N00026722 2014 2013-10-22 D H4TX28046 24K 2 4 C2100 N00030676 2014 2014-03-26 D

Wie erzwinge R, eine bestimmte Faktorstufe als Referenz in einer Regression zu verwenden?

Anzahl der Antworten 5 Antworten
Wie kann ich sagen, R, um eine bestimmte Ebene als Referenz nutzen, wenn ich binäre erklärende Variablen in einer regression? Es ist nur mit einigen level standardmäßig. lm(x ~ y + as.factor(b)) mit b {0, 1, 2,