Tag: outliers

Ein Ausreißer ist eine Beobachtung, die angezeigt werden ungewöhnliche oder nicht gut beschrieben, relativ zu einer einfachen Charakterisierung des Datensatzes.

Erkennen und ausschließen von Ausreißern in der Pandas-Daten-frame

Anzahl der Antworten 17 Antworten
Habe ich ein pandas dataframe mit wenigen Spalten. Jetzt weiß ich, dass gewisse Zeilen sind-Ausreißer, basierend auf einer bestimmten Spalte Wert. Beispielsweise Spalten - 'Vol' hat alle Werte um 12xx und ein Wert 4000 (Ausreißer). Nun würde

Entfernen von Ausreißern in R plot-Funktion

Anzahl der Antworten 1 Antworten
Ich versuche zu tun, ein scatterplot in R und würde lieben, Sie zu entfernen, einen Ausreißer habe ich bereits identifiziert. Meine plot-Funktion: attach(L) plot(independent variable, dependent variable, main="TITLE", xlab="x-axis label", ylab="y-axis label", pch=18, col="blue") text(independent variable, dependent

So erkennen Sie Ausreißer in einer ArrayList

Anzahl der Antworten 7 Antworten
Ich versuche mir einige code, der mir erlauben wird, durch meine ArrayList und Erkennung von Werten außerhalb des gemeinsamen Reihe "gute Werte." Beispiel: 100 105 102 13 104 22 101 Wie würde ich in der Lage sein,

Matlab beste Technik zum entfernen von Ausreißern in Daten

Anzahl der Antworten 1 Antworten
Ich habe 2 Spalten x, y von 100 Punkten. Ich möchte zum entfernen der Ausreißer-Daten und füllen Ihre Lücke mit dem Durchschnittswert der Punkte in der Nähe zu Ihnen. Erstens kann ich tun? ist eine beliebige Matlab-Funktion?

Ausreißer-Erkennung von time-series data in R

Anzahl der Antworten 1 Antworten
Welche Schritte sind notwendig, um zu erkennen, Ausreißer in business-sales-Daten (das heißt, es könnte sein, trends und Saisonalität) in R? Habe ich erfahren, ACF, PACF, Rest -, ARIMA-Modell (im Grunde, time series analysis und Modellierung). Kann ich

Statistische Ausreißer-Detektion in MATLAB

Anzahl der Antworten 3 Antworten
Angenommen, wir haben diese matrix : main = [10000 5 3 1; 5 5677 0 134; 1 1 456 3]; Diese Methode das am häufigsten verwendete Verfahren in ökonometrie und statistische Probleme.X sind unsere Daten, wir sind

Entfernen von Ausreißern in Pandas DataFrame mit Perzentilen

Anzahl der Antworten 3 Antworten
Ich habe einen DataFrame df mit 40 Spalten und sehr vielen Datensätzen. df: User_id | Col1 | Col2 | Col3 | Col4 | Col5 | Col6 | Col7 |...| Col39 Für jede Spalte außer die user_id-Spalte die

Das entfernen von Ausreißern aus einer k-mean-cluster

Anzahl der Antworten 2 Antworten
Ich habe die Nummer von kleineren Datensätzen, mit 10 XY-Koordinaten jedes. Ich bin mit Matlab (R2012a)und k-means zu erhalten, einen Schwerpunkt. In einigen Clustern (siehe Abbildung unten), sehe ich einige extreme Punkte, weil meine Daten so klein

Wie kann ich identifizieren die Etiketten von Ausreißern in R boxplot?

Anzahl der Antworten 3 Antworten
R boxplot-Funktion ist eine sehr nützliche Betrachtungsweise der Daten: es ist schnell, bietet eine visuelle Zusammenfassung der ungefähren Lage und Varianz der Daten, und die Anzahl der Ausreißer. Darüber hinaus möchte ich zu identifizieren, die Ausreißer, um

Wie zu verwenden Isolierung Wald

Anzahl der Antworten 2 Antworten
Ich versuche zu erkennen, die Ausreißer zu meinen Daten und ich finde die sklearn ist Isolierung Wald. Ich kann nicht verstehen, wie mit ihm zu arbeiten. Ich passe meine Trainings-Daten und es gibt mir wieder einen Vektor

Gewusst wie: ersetzen von Ausreißern mit dem 5. und 95. Perzentil, Werte in R

Anzahl der Antworten 4 Antworten
Möchte ich ersetzen Sie alle Werte in meinem relativ großen R dataset die Werte oberhalb der 95. und unterhalb der 5. Perzentile, mit denen Perzentil-Werte jeweils. Mein Ziel ist es zu vermeiden, einfach zuschneiden, diese Ausreißer aus

Kennzeichnung Ausreißer boxplots in R

Anzahl der Antworten 6 Antworten
Ich würde gerne plot-jeder Spalte einer matrix als boxplot und beschriften Sie dann die "Ausreißer" in einzelnen boxplots, wie Sie die Zeile name, dem Sie gehören, in die matrix. Um ein Beispiel zu gebrauchen: vv=matrix(c(1,2,3,4,8,15,30),nrow=7,ncol=4,byrow=F) rownames(vv)=c("one","two","three","four","five","six","seven") boxplot(vv)

Entfernen von Ausreißern voll von mehreren boxplots gemacht mit ggplot2 in R und zeigen die boxplots im erweiterten format

Anzahl der Antworten 5 Antworten
Habe ich einige Daten hier [in einem .txt-Datei], die lese ich in ein data frame df, df <- read.table("data.txt", header=T,sep="\t") Entferne ich die negativen Werte in der Spalte x (da Brauch ich nur die positiven Werte) der

Ausreißererkennung im data mining

Anzahl der Antworten 4 Antworten
Ich habe ein paar Fragen zur ausreißererkennung: Finden wir Ausreißer mit k-means und ist das ein guter Ansatz? Gibt es eine clustering-Algorithmus, der akzeptiert keine Eingabe durch den Benutzer? Können wir verwenden support-vector-machine oder andere betreute Lern-Algorithmus

Was sind die effiziente und präzise algorithmen, um auszuschließen, Ausreißer aus einer Reihe von Daten?

Anzahl der Antworten 7 Antworten
Habe ich 200 Datenzeilen(bedeutet eine kleine Menge von Daten). Ich möchte einen Teil der statistischen Analyse, aber vorher möchte ich ausschließen Ausreißer. Was sind die möglichen algos für den Zweck? Genauigkeit ist eine Frage der Sorge. Ich

Wie zu verwenden Ausreißer-Tests in R-Code

Anzahl der Antworten 4 Antworten
Als Teil meiner Daten, workflow-Analyse, möchte ich zu test für Ausreißer, und dann tun meine weitere Berechnung mit und ohne die Ausreißer. Ich habe festgestellt, das Ausreißer-Paket, das verschiedene tests, aber ich bin mir nicht sicher, wie

matplotlib: Ausreißer ignorieren beim Plotten

Anzahl der Antworten 2 Antworten
Ich bin Plotten von Daten aus verschiedenen tests. Manchmal in einem test habe ich zufällig einen Ausreißer (z.B. 0.1), während alle anderen Werte sind drei Größenordnungen kleiner. Mit matplotlib, ich Verschwörung gegen die Auswahl [0, max_data_value] Wie

So entfernen Sie Ausreißer aus einem Dataset

Anzahl der Antworten 8 Antworten
Habe ich einige multivariate Daten von beauty-vs-Alter. Das Alter von 20-40 in Abständen von 2 (20, 22, 24....40), und für jeden Datensatz der Daten, wie Sie gegeben werden eine Zeit und ein beauty-rating von 1-5. Wenn ich

Erkennen und Ausschließen von Ausreißern im Pandas-Datenrahmen

Anzahl der Antworten 10 Antworten
Habe ich ein pandas dataframe mit wenigen Spalten. Jetzt weiß ich, dass gewisse Zeilen sind-Ausreißer, basierend auf einer bestimmten Spalte Wert. Beispielsweise Spalten - 'Vol' hat alle Werte um 12.xx und einem Wert, der 4000 Nun würde

Brauchen Sie einen Datensatz für die Betrugserkennung

Anzahl der Antworten 2 Antworten
Habe ich ein fraud-detection-Algorithmus, und ich möchte, um zu sehen, ob es funktioniert gegen eine echte Welt-Daten-set. Mein Algorithmus sagt, dass ein Anspruch üblich ist oder nicht. Gibt es Daten-sets verfügbar? Kommentar zu dem Problem Ein neues