Wie berechnen Sie die Wahrscheinlichkeit, einen Wert aus einer Liste von Stichproben aus einer Verteilung in Python?

Nicht sicher, ob dies gehört in der Statistik, aber ich bin versucht, Python, dies zu erreichen. Ich habe im wesentlichen nur eine Liste von Integer-zahlen:

data = [300,244,543,1011,300,125,300 ... ]

Und ich würde gerne wissen, die Wahrscheinlichkeit, dass ein Wert Auftritt, gegeben diese Daten.
I dargestellten Histogramme der Daten mit matplotlib und erhalten diese:

Wie berechnen Sie die Wahrscheinlichkeit, einen Wert aus einer Liste von Stichproben aus einer Verteilung in Python?

Wie berechnen Sie die Wahrscheinlichkeit, einen Wert aus einer Liste von Stichproben aus einer Verteilung in Python?

In der ersten Grafik dargestellt, die zahlen repräsentieren die Anzahl der Zeichen in einer Sequenz. In der zweiten Grafik dargestellt, es ist eine gemessene Zeit in Millisekunden. Das minimum ist größer als null, aber es ist nicht unbedingt ein maximum. Die Grafiken wurden erstellt mit Millionen von Beispiele, aber ich bin mir nicht sicher, ich kann keine anderen Annahmen über die Verteilung. Ich möchte wissen, die Wahrscheinlichkeit, dass ein neuer Wert gegeben, dass ich ein paar Millionen Beispiele von Werten. In der ersten Grafik, ich habe ein paar Millionen Sequenzen verschiedener Längen. Würde gerne wissen, Wahrscheinlichkeit einer 200-Länge, zum Beispiel.

Ich weiß, dass für eine kontinuierliche Verteilung die Wahrscheinlichkeit eines genauen Punkt soll null sein, aber angesichts einer Flut neuer Werte, ich muss in der Lage sein zu sagen, wie wahrscheinlich jeder Wert ist. Ich habe mir durch einige der numpy/scipy Wahrscheinlichkeits-Dichte-Funktionen, aber ich bin mir nicht sicher, was zu wählen oder, wie die Abfrage für die neuen Werte, sobald ich so etwas wie laufen scipy.stats.norm.pdf(Daten). Es scheint, wie verschiedene Wahrscheinlichkeits-Dichte-Funktionen passen die Daten anders. Die Form der Histogramme ich bin mir nicht sicher, wie Sie entscheiden, welche zu verwenden.

  • Was ist die Natur dieser zahlen? Sie sind alle ganzen zahlen, gibt es einen festen Bereich? Können Sie keine Annahmen über die Verteilung (was machen die zahlen darstellen)?
  • Was genau möchten Sie wissen angesichts Ihrer dataset?
  • In der ersten Grafik dargestellt, die zahlen repräsentieren die Anzahl der Zeichen in einer Sequenz. In der zweiten Grafik dargestellt, es ist eine gemessene Zeit in Millisekunden. Das minimum ist größer als null, aber es ist nicht unbedingt ein maximum. Die Grafiken wurden erstellt mit Millionen von Beispiele, aber ich bin mir nicht sicher, ich kann keine anderen Annahmen über die Verteilung. Ich möchte wissen, die Wahrscheinlichkeit, dass ein neuer Wert gegeben, dass ich ein paar Millionen Beispiele von Werten. In graph1, ich habe ein paar Millionen Sequenzen verschiedener Längen. Würde gerne wissen, Wahrscheinlichkeit einer 200-Länge, zum Beispiel.
  • Für die zweite Grafik, wird Sie daran interessiert sein, die Wahrscheinlichkeit von einigen der gemessenen Höhe der Zeit, wenn man in einem bestimmten Intervall?
  • Sicher, was hast du im Sinn?
InformationsquelleAutor qazplok11 | 2016-08-02
Schreibe einen Kommentar