ECDF in python ohne Schritt-Funktion?
Ich habe mit ECDF (empirical cumulative distribution function) von statsmodels.Ausschüttungen an eine CDF-plot der Daten. Allerdings ECDF verwendet eine Schritt-Funktion und als Konsequenz bekomme ich gezackte Grundstücke.
Also meine Frage ist: scipy oder statsmodels haben eine ECDF gebacken-ohne Schritt-Funktion?
Übrigens, ich weiß, ich kann dies tun:
hist, bin_edges = histogram(b_oz, normed=True)
plot(np.cumsum(hist))
aber ich bekomme nicht die richtige Waage.
Dank!
- Wenn Sie sind besorgt über die Daten selbst, eine schöne sanity-check ist R-Funktion ecdf. Wenn Sie bequem R, ziehen Sie die Daten in R ein und starten Sie "plot(ecdf(your_data))", das sollte Ihnen eine zuverlässige Bild.
- Die ECDF ist per definition eine step-Funktion, was die tatsächlichen Daten. Keiner der gezeichneten Funktionen zu sein scheint, eine "wahre" ECDF. Zu sagen, "ECDF ohne Schritt-Funktion" scheint ein Widerspruch in sich.
- Diese Frage ist wirklich alt, aber ich denke, dass ich meinte, Sie zu beschreiben (oder annähernd) die wahre Verteilungsfunktion, die nicht aus der "step" - Funktionen.
- Sie könnte integrieren nur eine kernel-Dichte-Schätzung zu dem gewünschten Ergebnis.
Du musst angemeldet sein, um einen Kommentar abzugeben.
Wenn Sie nur wollen, ändern Sie den plot, dann könnte man lassen matplotlib interpolieren zwischen den beobachteten Werten.
oder Sortieren von original-Daten und plot
das ist das gleiche wie Plotten direkt
Hinweis: je nachdem, wie Sie wollen, die ecdf Verhalten an die Grenzen, und wie wird es zentriert sein, es gibt verschiedene Normierungen für die "plotting positions", die in die gemeinsame Nutzung, wie die parameter
a
, dass ich als Beispiel a=1 ist eine gemeinsame Wahl.Als alternative zur Verwendung der empirischen cdf, könnten Sie auch einen interpolierten oder geglättet ecdf-oder Histogramm-oder ein kernel-density-Schätzung.