Tag: categorical-data

Statistische Daten, deren Wert eins ist, eine Feste Anzahl von nominalen Kategorien.

geom_vline vertikale Linie auf der x-Achse mit der kategorischen Daten: ggplot2

Anzahl der Antworten 2 Antworten
Habe ich Daten, die geordnet in Klassen, wie in diesem Artikel beschrieben: https://www.r-bloggers.com/from-continuous-to-categorical/ Dies macht es leichter zu sehen, welche Werte sind üblich. Nach dem erstellen dieser Klassen will ich erstellen Sie einen barchart mit der Frequenz

Wie machen Streudiagramm mit zwei kategoriale Variablen auf der x-Achse in R

Anzahl der Antworten 1 Antworten
Ich versuche, ein scatter-plot in R mit zwei kategoriale Variablen auf der x-Achse. Für einen boxplot ich wissen, wie dies zu tun (siehe Erster Teil des Codes unten), aber irgendwie habe ich nicht für ein Streudiagramm. Ich

Lineare Regression mit sklearn mit kategorischen Variablen

Anzahl der Antworten 3 Antworten
Ich versuche zu laufen einer gewöhnlichen linearen regression in Python mit sk-lernen, aber ich habe einige kategoriale Daten, ich weiß nicht genau, wie zu handhaben, vor allem, weil ich importiert die Daten mit pandas read.csv() und ich

Finden Sie Art von Daten in jeder Spalte von dataframe

Anzahl der Antworten 1 Antworten
Habe ich diesen link Lesen: Überprüfen Sie die Spalten, die in DataFrame sind Kategorisch Ich habe einen dataframe, wo die Gehälter sind erwähnt mit einem $ vorangestellt. Es wird auch gezeigt, wie die kategorischen Daten. Außerdem nehme

Kategoriale Variablen In Ein Pandas Dataframe?

Anzahl der Antworten 3 Antworten
Arbeite ich meinen Weg durch Wes ' Python For Data Analysis, und ich habe ein seltsames problem, dass nicht angesprochen in dem Buch. In den folgenden code, basierend auf Seite 199 seines Buches, ich erstellen Sie einen

Anwenden von benutzerdefinierten Spalte, um (auf Kategorische) pandas boxplot?

Anzahl der Antworten 5 Antworten
EDIT: diese Frage stellte sich mit pandas ~0.13-und wurde überholt durch die direkte Unterstützung der irgendwo zwischen version 0.15-0.18 (als pro @Cireo die späte Antwort) Bekomme ich eine boxplot eines salary-Spalte in ein pandas DataFrame... train.boxplot(column='Salary', by='Category',

Wie mache ich eine boxplot mit zwei kategorischen Variablen in R?

Anzahl der Antworten 1 Antworten
Ich möchte einen boxplot, der zeigt, wie Zeit damit verbracht, ein Verhalten(Alert) betroffen ist, die von zwei Variablen (Zeit= Morgens/Nachmittags-und Besucher-Level= Low/High). Alert ~ Period + Vis.Level 'Alert' ist ein Satz von 12 zahlen, die zeigen, dass

Tukey HSD für gemischte kontinuierliche und kategoriale Variablen, Fehler: "keine Faktoren"

Anzahl der Antworten 1 Antworten
Ich versuche zu laufen, ein Tukey-test auf die Mortalität Daten, wo ich will, um zu testen, ob die Mortalität wird beeinflusst durch die Menge an Kupfer (in einem one-way-ANOVA) und der Kombination von Kupfer und Temperatur (in

wie zu überprüfen, um die Korrelation zwischen kontinuierlichen und kategorialen Variablen in python?

Anzahl der Antworten 1 Antworten
Ich habe einen Datensatz einschließlich der kategorialen Variablen(Binär) und kontinuierliche Variablen. Ich bin versucht, ein lineares Regressionsmodell für die Vorhersage einer kontinuierlichen variable. Kann jemand bitte lassen Sie mich wissen, wie Sie überprüfen, um die Korrelation zwischen

Wie führe ich die Funke Entscheidungsbaum mit einer kategorischen feature-set mit Scala?

Anzahl der Antworten 3 Antworten
Ich habe ein feature-set, das mit einem entsprechenden categoricalFeaturesInfo: Map[Int,Int]. Aber für das Leben von mir ich kann nicht herausfinden, wie ich bin, soll die Klasse DecisionTree zu arbeiten. Es wird nicht alles akzeptieren, aber eine LabeledPoint

Kreuztabelle mit mehreren Elementen

Anzahl der Antworten 7 Antworten
In SPSS, es ist (relativ) leicht zu erstellen Sie eine Kreuztabelle mit mehreren Variablen mit den Faktoren (oder Werte) wie aus der Tabelle überschrift. Also, so etwas wie die folgenden (aus-Daten, etc.). Q1, Q2 und Q3 jeweils

Wie behandeln kategorische Merkmale mit spark-ml?

Anzahl der Antworten 4 Antworten
Wie gehe ich mit kategorischen Daten mit spark-ml und nicht spark-mllib ? Dachte, die Dokumentation ist nicht sehr klar, es scheint, dass Klassifikatoren, z.B. RandomForestClassifier, LogisticRegression haben eine featuresCol argument gibt den Namen der Spalte Funktionen der

Anwenden von benutzerdefinierten Spalte, um die pandas boxplot?

Anzahl der Antworten 4 Antworten
Bekomme ich eine boxplot Gehalt-Spalte in ein pandas DataFrame... train.boxplot(column='PredictionError',by='Category',sym='') ...aber ich kann nicht herausfinden, wie definieren Sie den index-Reihenfolge auf die Spalte 'Kategorie' - ich will meine eigenen Auftrag, nach einem anderen Kriterium: category_order_by_mean_salary = train.groupby('Category')['Salary'].mean().order().keys()

Korrelation zwischen mehreren kategorialen Variablen (Pandas)

Anzahl der Antworten 3 Antworten
Ich habe einen Datensatz aus 22 kategorischen Variablen (nicht bestellt). Ich möchte zu visualisieren und deren Zusammenhang in einem schönen heatmap. Da die pandas gebaut, in Funktion DataFrame.corr(method='pearson', min_periods=1) nur umsetzen Korrelationskoeffizienten für numerische Variablen (Pearson,Kendall, Spearman),

konvertieren-Serie, DataFrame

Anzahl der Antworten 2 Antworten
Erstellte ich ein dataframe 'x' Ich wollte ein anderes dataframe y die darin besteht, die Werte der Funktion 'wheat_type' von dataframe x also habe ich ausgeführt, der code y=X.loc[:, 'wheat_type'] wenn ich folgenden Befehl ausgeführt y['wheat_type'] =

Arbeiten von labelEncoder in sklearn

Anzahl der Antworten 3 Antworten
Sagen, ich habe das folgende Eingabe-feature: hotel_id = [1, 2, 3, 2, 3] Dies ist eine kategoriale Funktion mit numerischen Werten. Wenn ich es auf das Modell wie es ist, das Modell zu behandeln, wird es als

Wie konvertiert kontinuierliche Variablen diskret in R?

Anzahl der Antworten 2 Antworten
Ich habe eine variable, die kodiert Gruppe-ID: d <- data.frame(group = c(0,1,0,2,1,3,2,0,1,2), x=c(1.2,2.3,3.2,2.1,1.3,1.5,2.3,0.4,1.3,1.7)) Wenn ich versuche, es in ggplot2 für die Herstellung von boxplots bekomme ich eine Fehlermeldung Kontinuierlichen Wert geliefert diskrete Skala Beim Versuch zum Rendern

Umwandlung Faktoren, die numerische Werte in R

Anzahl der Antworten 3 Antworten
Habe ich Faktoren in R, die Gehälter der form $100,001 - $150,000, over $150,000, $25,000 usw. und möchten, konvertieren Sie diese in numerische Werte (z.B. die Umwandlung der Faktor $100,001 - $150,000 auf den integer-125000). Ebenso habe

Umwandlung von kategorischen Werten binary mit pandas

Anzahl der Antworten 2 Antworten
Ich versuche zu konvertieren kategorische Werte in binäre Werte mit pandas. Die Idee ist, zu betrachten, jeden eindeutigen kategorialen Wert als eine Funktion (d.h. eine Spalte) und setzen Sie 1 oder 0, je nachdem, ob ein bestimmtes

Mosaik-plot mit Etiketten in jeder box zeigt einen Namen und einen Prozentsatz aller Beobachtungen

Anzahl der Antworten 1 Antworten
Ich würde gern ein Mosaik-plot (R-Paket, vcd, siehe z.B. http://cran.r-project.org/web/packages/vcd/vignettes/residual-shadings.pdf ) mit Beschriftungen innerhalb der Zeichnung. Die Etiketten zeigen, sollte entweder eine Kombination der verschiedenen Faktoren oder einige benutzerdefinierte Beschriftung und den Prozentsatz der Gesamtzahl der Beobachtungen

R coxph() Warnung: Loglik converged vor der variable

Anzahl der Antworten 1 Antworten
Ich habe einige Schwierigkeiten mit coxph(). Ich habe zwei kategoriale Variablen: Geschlecht und Wahrscheinliche Ursache, dass ich verwenden möchten, die als unabhängige Variablen. Sex ist nur die typisch männlichen/weiblichen aber Wahrscheinliche Ursache hat 5 Optionen. Ich weiß

Erstellen von Faktor-Variablen 'Wochenende' und 'Wochentag' vom Datum

Anzahl der Antworten 4 Antworten
Habe ich Folgendes dataframe. Dies ist nur der Kopf und die Termine erstrecken sich über einen Zeitraum von 2 Monaten. Meine Frage ist, wie kann ich eine neue Faktor-variable in der dataframe mit zwei Ebenen, "wochentags" und

pandas dataframe umwandeln Spalte Typ auf string oder kategorisch

Anzahl der Antworten 2 Antworten
Wie konvertiere ich eine einzelne Spalte ein pandas dataframe, type string? In der df von Daten Gehäuse unten ich brauche, um zu konvertieren, zipcode, string so, dass wenn ich die lineare regression, Postleitzahl behandelt wird, als kategoriale

Problem mit OneHotEncoder für kategoriale Merkmale

Anzahl der Antworten 5 Antworten
Will ich Kodieren 3 kategorische Merkmale von 10 Funktionen in meinen Datensätzen. Ich benutze preprocessing aus sklearn.Vorverarbeitung so tun, als die folgende: from sklearn import preprocessing cat_features = ['color', 'director_name', 'actor_2_name'] enc = preprocessing.OneHotEncoder(categorical_features=cat_features) enc.fit(dataset.values) Allerdings konnte

R-Fehler "Summe nicht sinnvoll für Faktoren"

Anzahl der Antworten 1 Antworten
Habe ich eine Datei namens rRna_RDP_taxonomy_phylum mit den folgenden Daten : 364 "Firmicutes" 39.31 244 "Proteobacteria" 26.35 218 "Actinobacteria" 23.54 65 "Bacteroidetes" 7.02 22 "Fusobacteria" 2.38 6 "Thermotogae" 0.65 3 unclassified_Bacteria 0.32 2 "Spirochaetes" 0.22 1 "Tenericutes"

Plotten mit ggplot2: "Fehler: Discrete value supplied to continuous scale" auf kategorische y-Achse

Anzahl der Antworten 3 Antworten
Plotting code unten gibt Error: Discrete value supplied to continuous scale Was ist falsch an diesem code? Es funktioniert gut, bis ich versuche, ändern Sie den Maßstab so, der Fehler ist es... ich habe versucht, um herauszufinden,

Wie (und warum) benutzt du Kontraste?

Anzahl der Antworten 2 Antworten
Unter welchen Fällen schaffen Sie Kontraste in Ihre Analyse? Wie ist es und wofür wird es verwendet? Habe ich überprüft ?contrasts und ?C - beide führen zu "Kapitel 2 Statistische Modelle in S", die nicht leicht zugänglich

XGBoost Kategoriale Variablen: Verdummung vs Codierung

Anzahl der Antworten 2 Antworten
Bei der Verwendung XGBoost wir brauchen, um zu konvertieren kategorischen Variablen in numerische. Gäbe es irgendeinen Unterschied in der Leistung/Evaluierung von Metriken zwischen den Methoden: dummifying Ihre kategorische Variablen Kodierung der kategorialen Variablen (z.B. aus (a,b,c) ,

Erstelle Dummies aus einer Spalte mit mehreren Werten in Pandas

Anzahl der Antworten 3 Antworten
Ich bin auf der Suche, für ein pythonic Weg, um behandeln Sie das folgende problem. Den pandas.get_dummies() Methode ist nützlich für die Erstellung von dummies aus eine kategorische Spalte ein dataframe. Zum Beispiel, wenn in der Spalte

Erstellen Sie ein Frequenzhistogramm für Faktorvariablen

Anzahl der Antworten 5 Antworten
Ich bin sehr neu in R, so entschuldige ich mich für solch eine grundlegende Frage. Ich verbrachte eine Stunde googeln dieses Problem, konnte aber keine Lösung finden. Sagen, ich habe einige von kategorischen Daten in meiner Daten

Fügen Sie zusätzliche Faktoren zu Faktoren im Datenrahmen hinzu

Anzahl der Antworten 5 Antworten
Habe ich einen Daten-frame mit numerischer und bestellt Faktor Spalten. Ich habe eine Menge von NA-Werte, so dass keine Ebene zugeordnet. Ich änderte NA, "Keine Antwort", sondern Stufen des Faktors Spalten nicht enthalten, also hier ist, wie

Wie erzwinge R, eine bestimmte Faktorstufe als Referenz in einer Regression zu verwenden?

Anzahl der Antworten 5 Antworten
Wie kann ich sagen, R, um eine bestimmte Ebene als Referenz nutzen, wenn ich binäre erklärende Variablen in einer regression? Es ist nur mit einigen level standardmäßig. lm(x ~ y + as.factor(b)) mit b {0, 1, 2,