Tag: missing-data
Bei Fragen zu fehlenden Daten Probleme, die sich mit speziellen Datenstrukturen, algorithmen, statistische Methoden, Modellierung Techniken, Visualisierung, unter anderen Betrachtungen.
5
Antworten
Weiß jemand, wie gbm im R Griffe für fehlende Werte? Ich kann nicht scheinen zu finden, eine Erklärung, mit google. Genau das detail, was suchst du? Die Hilfe-Seite für ?gbm zeigt, dass Sie mit fehlenden Werten. Möchten
7
Antworten
Arbeite ich auf einer machine-learning-problem, in denen es viele fehlende Werte in den Funktionen. Es gibt 100 von den features, und ich möchte zu löschen, diese Funktionen, die zu viele fehlende Werte (es kann sein, Funktionen mit
2
Antworten
Diese Frage wurde migriert von Cross-Validiert, da es sein kann, antwortete auf Stack Overflow. Migriert 6 Jahren. Erfahren Sie mehr. Für meine wiederholte Maßnahmen Analyse mit lme Funktion konnte ich weglassen-nicht verfügbar (na) Daten mit dem Befehl:
1
Antworten
Habe ich folgende Daten Rahmen: df1 <- data.frame(id = 1:20, fact1 = factor(rep(c('abc','def','NA',''),5))) df1 id fact1 1 1 abc 2 2 def 3 3 NA 4 4 5 5 abc 6 6 def 7 7 NA 8
1
Antworten
Möchte ich eine rollierende Berechnung auf fehlende Daten. Beispielcode: (Zur Vereinfachung gebe ich ein Beispiel für eine rollende Summe, aber ich möchte etwas tun, mehr generische.) foo = lambda z: z[pandas.notnull(z)].sum() x = np.arange(10, dtype="float") x[6] =
1
Antworten
Ich will das Daten-Analyse-toolpack (und sonstige Analysen durchführen) auf Daten, welche (unabsichtlich), haben Saiten, wo es sein sollte zahlen. Ich könnte zum Beispiel eine Spalte: 0, 1, don't know, 7 Benutze ich folgende Anweisung zum erstellen einer
2
Antworten
Ich bin arbeiten mit einem großen Datensatz von billing-records für meine klinische Praxis über 11 Jahren. Schon ein paar Zeilen fehlen der überweisende Arzt. Allerdings mit einigen Regeln kann ich ganz einfach füllen Sie Sie in, wissen
2
Antworten
Alle, Ich habe eine Frage, ich fürchte es möglicherweise auch Fußgänger hier Fragen, aber die Suche nach es an anderer Stelle führt mich in die Irre. Ich kann nicht die richtigen Suchbegriffe. Ich habe eine panel-Daten-frame (Land-Jahr)
1
Antworten
Habe ich versucht zu trainieren, ein random forest mit Kreuzvalidierung und verwendet die caret Paket zum trainieren des rf: ### variable return_customer = binary variable idx.train <- createDataPartition(y = known$return_customer, p = 0.8, list = FALSE) train
3
Antworten
Habe ich eine Fernbedienung ist die gleiche, oder ähnliche, an das Schienen-Projekt in meiner aktuellen Verzeichnis. Zum synchronisieren der beiden, ich weiß git init git remote add origin blah@blah git pull Das problem ist, dass einige der
1
Antworten
Den gnuplot-Befehl set datafile missing "nan" sagt gnuplot zu ignorieren nan Daten-Werte in der Daten-Datei. Wie ignorieren nan und -nan? Ich habe versucht, die folgenden in gnuplot, aber dann ist die Wirkung der ersten Anweisung wird überschrieben
1
Antworten
Ich habe eine große Datenbank, die aus gemischten Datentypen (numerisch, Zeichen -, Faktor -, ordinal-Faktor) mit fehlenden Werten, und ich bin versuchen, erstellen Sie eine for-Schleife als Ersatz für die fehlenden Werte entweder den Mittelwert der jeweiligen
16
Antworten
Möchte ich entfernen Sie die Zeilen in diesem data-frame: a) enthalten NAs über alle Spalten. Unten ist meine Beispiel-Daten-frame. gene hsap mmul mmus rnor cfam 1 ENSG00000208234 0 NA NA NA NA 2 ENSG00000199674 0 2 2
1
Antworten
Arbeite ich mit panel-Daten. Ich habe weit über 6.000 Land-Jahr-Beobachtungen, und angegeben haben, meine Amelia Anrechnung wie folgt: (CountDependentVariable, m=5, ts="year", cs="cowcode", sqrts=c("OtherCountVariable2", "OtherCount3", "OtherCount4"), ords=c("OrdinalVar1", "Ordinal Variable 2"), lgstc=c("ProportionVariale"), noms=c("NominalVar1"),p2s = 0, idvars = c("country")) Wenn
6
Antworten
Habe ich cell-array, die jeweils eine Sequenz von Werten als einen zeilenvektor. Die Sequenzen enthalten einige fehlende Werte vertreten durch NaN. Möchte ich alle ersetzen, NaNs über irgendeine Art von interpolation, wie kann ich dies in MATLAB?
3
Antworten
Habe ich einen Faktor namens RAUCH mit Ebenen "Y" und "N". Fehlende Werte wurden ersetzt durch NA (von der ersten Ebene "NULL"). Aber wenn ich den Faktor bekomme ich so etwas wie dieses: head(SMOKE) N N <NA>
3
Antworten
Ich bin mit der Funktion confusionMatrix im R Paket caret berechnen einige Statistiken, die für einige Daten, die ich habe. Ich habe seit Inbetriebnahme meines Vorhersagen sowie meine tatsächlichen Werte in der table - Funktion, um die
7
Antworten
Dem folgenden code funktioniert aber nicht. import pandas as pd import numpy as np df=pd.DataFrame(['ONE','Two', np.nan],columns=['x']) xLower = df["x"].map(lambda x: x.lower()) Wie sollte ich mich zwicken, um Sie zu erhalten xLower = ['eins','zwei',np.nan] ? Effizienz ist wichtig,
4
Antworten
Habe ich mehrere Dateien von Daten, die wie folgt Aussehen: X code year month day pp 1 4515 1953 6 1 0 2 4515 1953 6 2 0 3 4515 1953 6 3 0 4 4515 1953
4
Antworten
Bin ich lernen, wie man Imputer auf Python. Dies ist mein code: df=pd.DataFrame([["XXL", 8, "black", "class 1", 22], ["L", np.nan, "gray", "class 2", 20], ["XL", 10, "blue", "class 2", 19], ["M", np.nan, "orange", "class 1", 17], ["M",
3
Antworten
Ich habe ein problem mit NA in einen Faktor, variable, da ggplot bezieht Sie in die Handlung, als ob Sie eine andere Kategorie/Stufe. Ich möchte drop die Daten fehlen. Es tut mir Leid ich habe keine code
2
Antworten
Diese Frage ist in Bezug auf einen post mit einem ähnlichen Titel (ersetzen, NA in einen R-Vektor mit den angrenzenden Werte). Ich Scannen möchte eine Spalte in einem Daten-frame und ersetzen NA das mit dem Wert in
8
Antworten
Habe ich die folgenden Daten-frame (vereinfacht) mit der variable "Land" als Faktor und dem Wert der variable fehlende Werte: country value AUT NA AUT 5 AUT NA AUT NA GER NA GER NA GER 7 GER NA
4
Antworten
Habe ich einen Daten-frame, die ist angeordnet in absteigender Reihenfolge der Datum. ps1 = data.frame(userID = c(21,21,21,22,22,22,23,23,23), color = c(NA,'blue','red','blue',NA,NA,'red',NA,'gold'), age = c('3yrs','2yrs',NA,NA,'3yrs',NA,NA,'4yrs',NA), gender = c('F',NA,'M',NA,NA,'F','F',NA,'F') ) Möchte ich unterstellen(ersetzen) NA Werte mit früheren Werten und gruppiert
5
Antworten
Ich habe eine riesige vector, die hat ein paar NA Werte, und ich bin auf der Suche nach dem max-Wert in diesem Vektor (der Vektor alle zahlen), aber ich kann das nicht, weil der NA Werte. Wie
1
Antworten
Ich habe einen Vektor von ganzen zahlen zwischen 0 und 5. Ich will berechnen Sie ein Histogramm zählt. Zum Beispiel: y <- c(0, 0, 1, 3, 4, 4) table(y) # y # 0 1 3 4 #
3
Antworten
Ich habe einen Vektor mit NA Werte, die würde ich gerne ersetzen durch einen neuen Faktor level NA. a = as.factor(as.character(c(1, 1, 2, 2, 3, NA))) a [1] 1 1 2 2 3 <NA> Levels: 1 2
4
Antworten
Ich bin strugling Rekodierung fehlender Werte in SPSS mit Hilfe der grafischen Benutzeroberfläche. Ich kann einfach recodieren von numerischen Variablen mithilfe der GUI und der Dialog unten gezeigt: Aber wenn ich geben Sie einen string variable in
2
Antworten
Ich versuche zu ersetzen der fehlenden Werte durch die entsprechenden Werte aus der gleichen Spalte abhängig von Ihrer Gleichheit aus anderen Spalten: Ich habe verschiedene Firmen aus verschiedenen Branchen & Ländern und aus unterschiedlichen Jahren. Unten ist
4
Antworten
Ich bin sicher, das ist albern, aber ich kann einfach nicht umgehen. Ich habe ein Wörterbuch, wie dieses, mit ungleichen Anzahl von Werten für jede Taste: 'John greased ': ['axle', 'wheel', 'wheels', 'wheel', 'engine', ''], 'Paul alleged
8
Antworten
Ich bin versucht zu schreiben, eine Funktion in R, die dauert 3 Eingänge: Verzeichnis Schadstoff id Ich habe ein Verzeichnis auf meinem computer voll von CSV-Dateien, d.h. über 300. Was diese Funktion tun würde, ist in der
2
Antworten
Ich bin den Import einer sehr großen Datensatz in SPSS. Viele Felder im dataset enthalten eine "999" - Wert, der angibt, einen fehlenden Wert. Ich möchte SPSS anweisen, Sie zu betrachten als solche. Jedoch standardmäßig jede variable
2
Antworten
Meine Frage ist relativ einfach, aber ich konnte es nicht behoben ist, nachdem versucht, eine Menge Dinge. Habe ich zwei Daten-frames. >a col1 col2 col3 col4 1 1 2 1 4 2 2 NA 2 3 3
1
Antworten
Ich habe einen Datensatz, wie dies 4 6 18 12 4 5 2 9 0 3 NA 13 11 NA 6 7 7 9 Wie ich kann füllen Sie die fehlenden Werte mit R? Jedoch Sie mögen.
3
Antworten
Ich zuordnen np.nan der fehlenden Werte in einer Spalte ein DataFrame. Der DataFrame wird dann geschrieben, um eine csv-Datei mit to_csv. Die resultierende csv-Datei richtig hat nichts zwischen den Kommas für die fehlenden Werte wenn ich öffnen
3
Antworten
Ich versuche Teilmenge einen Daten-frame, indem die ganzzahligen Werte von 2 Spalten om meine-Daten-frame Subs1<-subset(DATA,DATA[,2][!is.na(DATA[,2])] & DATA[,3][!is.na(DATA[,3])]) aber es gibt mir eine Fehlermeldung : mehr-Objekt-Länge nicht ein Vielfaches kürzer Objekt Länge. Wie kann ich konstruieren Sie eine
2
Antworten
Ich versuche, eine Funktion schreiben, die dreht sich Null-Werte in NA. Eine Zusammenfassung von einem meiner Spalte sieht wie folgt aus: a b 12 210 468 Möchte ich ändern 12 leere Werte NA. Ich habe auch ein
3
Antworten
Aus irgendeinem Grund, wenn ich angeben glms (und lm ' s zu, es stellt sich heraus), R ist nicht die Vorhersage der fehlenden Werte der Daten. Hier ist ein Beispiel: y = round(runif(50)) y = c(y,rep(NA,50)) x
2
Antworten
Habe ich ein pandas dataframe mit monatlichen Daten, die ich möchte, zur Berechnung der 12 Monate gleitende Durchschnitt. Daten für jeden Monat, der Januar fehlt allerdings (NaN), so bin ich mit pd.rolling_mean(data["variable"]), 12, center=True) aber es macht
2
Antworten
Ich habe eine data.frame mit 15.000 Beobachtungen der Ordnungszahl 34 und NA Variablen. Ich trete clustering für die Segmentierung des Marktes studieren und müssen die Zeilen mit nur NAs entfernt. Nach dem herausnehmen der userID bekam ich
6
Antworten
Ich versuche eine neue Spalte erstellen, basierend auf Spalten. Angenommen, ich möchte erstellen Sie eine neue Spalte z, und es sollte den Wert von y, wenn es nicht fehlt, und der Wert von x, wenn y ist
2
Antworten
Wo bekomme ich Flexslider2 image-Datei für die Richtung nav Zeiger: bg_direction_nav.png? Konnte nicht herausfinden, warum ich immer wieder seltsame text wie " Fl "oder" Fi " anstelle der Pfeile auf den Schieberegler. Die Kontrolle über alles, was,
2
Antworten
Ich versuche zu laufen ein lme-Modell mit diesen Daten: tot_nochc=runif(10,1,15) cor_partner=factor(c(1,1,0,1,0,0,0,0,1,0)) age=runif(10,18,75) agecu=age^3 day=factor(c(1,2,2,3,3,NA,NA,4,4,4)) dt=as.data.frame(cbind(tot_nochc,cor_partner,agecu,day)) attach(dt) corpart.lme.1=lme(tot_nochc~cor_partner+agecu+cor_partner *agecu, random = ~cor_partner+agecu+cor_partner *agecu |day, na.exclude(day)) Bekomme ich diesen Fehler code: Fehler in na.fail.Standard(list(cor_partner = c(1L, 1L, 2L, 1L,
7
Antworten
Ich derzeit kam mit der Arbeit, Tips und Tricks, um die Anzahl von fehlenden Werten in pandas DataFrame. Die sind ziemlich hässlich und ich Frage mich, ob es gibt ein besserer Weg, es zu tun. Erstellen wir
2
Antworten
bitte werfen Sie einen Blick auf diese: http://jsfiddle.net/2rNzr/ var chart = new Highcharts.Chart({ chart: { renderTo: 'container' }, xAxis: { categories: ['Jan', 'Feb', 'Mar', 'Apr', 'May', 'Jun', 'Jul', 'Aug', 'Sep', 'Oct', 'Nov', 'Dec'] }, series: [{ data:
4
Antworten
In R kann ich schnell siehe a Anzahl der fehlenden Daten über die summary - Befehl, aber das entspricht pandas DataFrame Methode describe meldet sich nicht auf diese Werte. Entnehme ich, kann ich etwas tun, wie len(mydata.index)
5
Antworten
ich bin mit terminal [eclipse]. ich habe folgende Ausnahme Fehlermeldung, während ich emulator.debug erfolgreich und erfolgreich installiert. Aber emulator zeigen Unfortunatly app has stop. Dann Lauf ich $ adb logcat es wird die folgende Anzeige. java.lang.NoClassDefFoundError: android.support.v7.appcompat.R$styleable
10
Antworten
Hier ein kleines Stück code, den ich schrieb, um zu melden Variablen mit fehlenden Werten aus einem Daten-frame. Ich versuche gerade ein eleganter Weg, dies zu tun, vielleicht gibt ein Daten.Rahmen, aber ich bin hängen geblieben: for
7
Antworten
Ist es möglich, fehlende Werte in scikit-learn ? Wie sollte Sie dargestellt werden? Ich konnte keine Dokumentation darüber. InformationsquelleAutor der Frage Vladtn | 2012-02-20
7
Antworten
Ich bin neu in R aber verwandelt haben, um es zu lösen, ein problem mit einer großen Datenmenge, die ich versuche zu verarbeiten. Derzeit habe ich 4 Spalten von Daten (Y-Werte) gegen-Minuten-Intervall Zeitstempel (Monat/Tag/Jahr Stunde:Minute) (X-Werte) wie