Gewusst wie: ersetzen von Ausreißern mit dem 5. und 95. Perzentil, Werte in R

Möchte ich ersetzen Sie alle Werte in meinem relativ großen R dataset die Werte oberhalb der 95. und unterhalb der 5. Perzentile, mit denen Perzentil-Werte jeweils. Mein Ziel ist es zu vermeiden, einfach zuschneiden, diese Ausreißer aus den Daten ganz.

Jede Beratung würde sehr geschätzt, ich finde keine Informationen, wie dies überall sonst.

Daneben gibt es viele weitere details erforderlich, um diese Frage zu beantworten, sind Sie wirklich sicher, dass Sie dies tun wollen? Eine relativ große Datenmenge von sagen wir 100 zahlen, werden 5 Werte unterhalb der 5. Perzentile und 5 oberhalb der 95. Perzentile, wenn es keine Ausreißer.
Große Sorgfalt bei der Einnahme von diesen Arten von Maßnahmen, die Sie drastisch ändern Ihre Statistiken auf dataset. Wenn dieser gültig ist, hängt davon ab, was Sie versuchen, aus den Daten und der Verteilung der Daten (z.B. Normalverteilung).
seien Sie vorsichtig mit der Verwendung von = als Zuweisungsoperator. Die <- kann noch verstärkt werden, aber = kann nicht
Ich verwende fast immer =, und ich habe selten in Schwierigkeiten. Nur in aufrufen wie system.time(bla <- spam()) ist die <- obligatorisch.
Bobbo, die fehlenden Angaben umfassen würde, was das Modell ist und wie Ihnen die Definition Ihrer Perzentile; ob Sie wollten empirischen Abkürzungen aus den Daten abgeleitet oder cutoffs abgeleitet von einem Modell, und was das Modell ist, und speziell, wie Sie wollte, die durch die Punkte ersetzt,... " ersetzen durch random-Werte mit Hilfe der Modell-Parameter?... eine andere form der Zuschreibung? tack zurück auf das Ende? Zusätzlich, was Sie tun, keine Prüfung der Robustheit von selbst. Es würde erfordern das hinzufügen etwas anderes.

InformationsquelleAutor Bobbo | 2012-11-12

Schreibe einen Kommentar