Tag: statistics

Prüfen Sie, ob Ihre Frage wäre besser an http://stats.stackexchange.com. Die Statistik ist das mathematische Studium mit Wahrscheinlichkeit zu folgern, Merkmale einer population nur aus einer begrenzten Anzahl von Stichproben oder Beobachtungen.

Setzen Ergebnisse der for-Schleife in einen Daten-frame in R

Anzahl der Antworten 1 Antworten
Ich habe eine Funktion, die zurückkehren wird eine numerische Objekt-Klasse, hier ist eine vereinfachte version: count.matches <- function(x) { ifelse(!is.na(a[,x] & a[,2]),1,0) } es nur, erzeugt ein Objekt von 0s und 1s. Zum Beispiel count.matches(4) [1] 0

Wie man eine CDF von einem Histogramm in MATLAB

Anzahl der Antworten 2 Antworten
Ich versuche zu erstellen, die Funktion, die ein Histogramm und macht eine CDF von ihm. Allerdings kann ich nicht verwenden, die cdfplot - Funktion in Matlab. Wie würde ich gehen über das tun dies? Dies führt zu

So erstellen Sie eine Faktor-Interaktion variable in R? Warum kann ich nicht einfach multiplizieren?

Anzahl der Antworten 2 Antworten
Mache ich eine OLS-regression, und ich versuche, eine Interaktion erstellen, die variable. Um dies zu tun, soweit ich weiß, habe ich nur mehrere zwei-Variablen zusammen. Das ist jedoch nicht arbeiten. Sagen wir, ich habe die Variablen Rasse

Student-t-Verteilung, die in JavaScript für die Google-Tabelle

Anzahl der Antworten 3 Antworten
Google Tabellen derzeit nicht die Unterstützung der standard-Funktion TDIST - d.h. der Student-t-Verteilung. Diese Funktion ist entscheidend für die Berechnung der p-Werte. Scheint es, dass dies im Zusammenhang mit der Tatsache, dass keine Integrale-Funktionen verwenden (AFAICT) sind

Der beste Weg, um zu berechnen, Klassifikation, Genauigkeit?

Anzahl der Antworten 1 Antworten
Ich kenne eine Formel zur Berechnung der klassifikationsgenauigkeit ist X = t /n * 100 (wo t ist die Anzahl der korrekten Einstufung und n ist die Gesamtzahl der Proben. ) Aber, sagen wir, wir haben insgesamt

Gibt es eine Möglichkeit zu wissen, wenn jemand Lesezeichen Ihrer website?

Anzahl der Antworten 7 Antworten
Geschlossen. Diese Frage ist off-topic. Es ist derzeit nicht akzeptieren Antworten. verbessern Wollen dieser Frage? "Update" die Frage so ist es on-topic für Stack-Überlauf. Geschlossen 6 Jahren. Möchte ich die Statistiken für meine website. Eine Sache, die

R - cut-Vektor

Anzahl der Antworten 2 Antworten
Habe ich 503 Datenpunkte und ich will zu schneiden entfernt die Letzte 250, um die 253. Versuchte ich cut ,aber diese Funktion gibt nur mich Gruppen wieder... Wie kann ich das in R? InformationsquelleAutor maximus | 2013-05-15

bestimmen, wie "gut" ist eine Korrelation in matlab?

Anzahl der Antworten 2 Antworten
Arbeite ich mit einem Satz von Daten und ich habe erhalten eine bestimmte Korrelationen (pearson ' s Korrelationskoeffizient). Ich wurde gebeten, zu bestimmen, die "Qualität der Korrelation," und meine Vorgesetzten bedeutet, dass er will, um zu sehen,

Matlab - Transformation der kontinuierlichen Daten in diskrete Daten

Anzahl der Antworten 2 Antworten
Gibt es irgendwelche Techniken, die angewendet werden für die Umwandlung von kontinuierlichen Daten in diskrete Daten? Durch die kontinuierlichen Daten, die ich beziehe mich auf die Ausgabe von Werten, die von verschiedenen Funktionen. Zum Beispiel der generierte

Wie finde ich die Korrelation und die Kovarianz-matrix, die aus a-Daten mit einer dummy-variable?

Anzahl der Antworten 4 Antworten
Ich habe einen Datensatz, der die Spalte Namen, Geschlecht, IQ, und Brain_Mass. Nur das Geschlecht ist eine kategoriale variable natürlich, also gab ich es eine dummy-variable, indem es als gender=factor(Gender). Allerdings möchte ich zu finden, die Kovarianzmatrix

Wie ist die Einheitlichkeit zum Ausdruck?

Anzahl der Antworten 2 Antworten
Ich weiß nicht, etwas über Statistik und es war schwierig für mich, Einen Weg zu finden, um zu beschreiben, meine Frage war klar. Ich bin dabei einige anfängliche Forschung auf ein system, dass die Messung der Homogenität

R Dateien Lesen mit for-Schleife

Anzahl der Antworten 3 Antworten
Ich nur verwenden möchten, verwenden Sie 10 Dateien in R. Für jedes I berechnen möchten, etwas. Exp. Datei: stat1_pwg1.aus stat23_pwg2.aus .. stat45_pwg10.aus Ich versuche dieses: for (i in 1:10){ Data=paste("../XYZ/*_pwg",i,".out",sep="") line=read.table(Data,head=T) } Aber es funktioniert nicht? Alle

Besseren Weg, um zu entfernen statistischen Ausreißer als das?

Anzahl der Antworten 4 Antworten
Dieser code funktioniert. Aber ich kann mir nicht helfen aber das Gefühl, es ist ein hack, besonders der "offset" - Teil. Ich hatte damit zu tun, weil sonst alle index-Werte löscht, werden verschoben, indem man jedes mal,

Holen Sie sich eine Unterliste einer Liste

Anzahl der Antworten 2 Antworten
Ich habe einen vector, die um 3000 Elemente lang. Ich habe extrahiert einen bestimmten Punkt in den vector mit which(...). Das will ich jetzt haben -120 before diesem Punkt und +120 after diesem Punkt. Meine Liste sieht

Python - Minimierung der Chi-Quadrat

Anzahl der Antworten 1 Antworten
Ich habe versucht, passen Sie ein lineares Modell, um eine Reihe von stress - /Dehnungs-Daten durch die Minimierung der chi-Quadrat. Leider mit dem code unten ist nicht korrekt Minimierung der chisqfunc Funktion. Es ist die Suche nach

Modell-Fit-Statistiken für eine Logistische Regression

Anzahl der Antworten 5 Antworten
Bin ich mit einem logistischen Regressionsmodell, in R. ich habe sowohl die Zelig und die Auto-Pakete. Allerdings Frage ich mich, ob es ist ein einfacher Weg, um die Modell-fit-Statistiken für das Modell. (pseudo-R-Quadrat, chi-Quadrat, log-liklihood,etc) Finden Sie

Mahalanobis-Distanz zwischen zwei Vektoren

Anzahl der Antworten 1 Antworten
Habe ich versucht zu übernehmen mahal zur Berechnung der Mahalanobis-Distanz zwischen 2 Zeilen-Vektoren von 27 Variablen, ich.e mahal(X, Y), wo X und Y sind die zwei Vektoren. Jedoch, es kommt mit einem Fehler: The number of rows

R: Vorhersage (0,1) in die Logistische regression in glm()

Anzahl der Antworten 2 Antworten
Ich versuche, das Modell einer "was wäre wenn" - situation in einem binären logit-Modell. Ich bin der Schätzung der Wahrscheinlichkeit, an einem test, da der Schwierigkeitsgrad der Prüfung (1=einfachste, 5=härteste), mit Geschlecht als Kontrolle. (Die Daten hier).

Signifikanz-test auf die Differenz zweier Korrelationskoeffizienten

Anzahl der Antworten 2 Antworten
How do you test, ob sich zwei Korrelationskoeffizienten sind signficantly anders - in GNU R? Ist, wenn die Wirkung zwischen den gleichen Variablen (z.B. Alter und Einkommen) unterscheidet sich in zwei verschiedene Populationen (teilproben). Hintergrund-Informationen finden Sie

Matlab-test auf Unabhängigkeit

Anzahl der Antworten 2 Antworten
Für 1.000.000 Beobachtungen, die ich beobachtet eine diskrete Ereignis -, X, 3 mal für die Kontroll-Gruppe und 10 mal für die test-Gruppe. Muss ich preform ein Chi-Quadrat-test auf Unabhängigkeit in Matlab. Dies ist, wie Sie es tun

Überlagern sich mehrere Histogramme mit pandas

Anzahl der Antworten 1 Antworten
Habe ich zwei oder drei csv-Dateien mit dem gleichen header und weisen die Histogramme für jede Spalte überlagern einander auf demselben Grundstück. Folgende code gibt mir zwei getrennte zahlen, die jeweils alle Histogramme für jede der Dateien.

Naive Bayes-Klassifizierung Zeile

Anzahl der Antworten 1 Antworten
Wie ordnet man eine Reihe von separaten Zellen in MATLAB? Im moment kann ich klassifizieren einzelne coloums etwa so: training = [1;0;-1;-2;4;0;1]; % this is the sample data. target_class = ['posi';'zero';'negi';'negi';'posi';'zero';'posi']; % target_class are the different target

wie plot gemeinsame distribtuion von 2 Zufallsvariablen mit 1000 Daten

Anzahl der Antworten 1 Antworten
hier ist der code, den ich schrieb zu generieren Wahrscheinlichkeit distribtuion von zwei Zufallsvariablen. jetzt möchte ich den plot JPD. clear all; clc; x1 = randn(1000,1); x2 = 10*randn(1000,1); [count_1, b] = hist(x1, 25); %25 bins pd1

scipy stats geometrische Mittel NaN zurück

Anzahl der Antworten 1 Antworten
Ich bin mit scipy ist gmean() Funktion ermittelt den geometrischen Mittelwert eines numpy array mit Spannung Ausgänge. Der Bereich der zahlen zwischen -80.0 und 30.0. Derzeit ist die numpy-array ist zweidimensional, was der Spannung für zwei verschiedene

Python - berechnen Normalverteilung

Anzahl der Antworten 3 Antworten
Ich bin ganz neu bei python-Welt. Auch ich bin kein Statistiker. Ich bin in der Notwendigkeit der Umsetzung der mathematischen Modelle entwickelt Mathematiker in der informatik-Programmiersprache. Ich habe gewählt, python, nachdem einige der Forschung. Ich bin wohl

Separate Mischung von gaussfunktionen in Python

Anzahl der Antworten 1 Antworten
Es ist das Ergebnis von einigen physikalischen experiment, welches dargestellt werden kann als ein Histogramm [i, amount_of(i)]. Ich nehme an, dass Ergebnis kann geschätzt werden, indem eine Mischung von 4 - 6 Gauß-Funktionen. Gibt es ein Paket

Was tun alle Distributionen verfügbar in scipy.stats Aussehen?

Anzahl der Antworten 0 Antworten
Visualisierung scipy.stats Distributionen Einem Histogramm kann man aus die scipy.stats normal random variable zu sehen, wie die Verteilung aussieht. % matplotlib inline import pandas as pd import scipy.stats as stats d = stats.norm() rv = d.rvs(100000) pd.Series(rv).hist(bins=32,

Die gegenseitige Information von MATLAB Matrix

Anzahl der Antworten 1 Antworten
Ich habe eine quadratische matrix, repräsentiert die Häufigkeit zählt der co-occurrences in einem Daten-set. In anderen Worten, die Zeilen repräsentieren alle möglichen Beobachtungen des Merkmals 1, und die Spalten sind die möglichen Beobachtungen von feature-2. Die Zahl

Generieren Poisson-Prozess mit R

Anzahl der Antworten 2 Antworten
Will ich erzeugen, ein Prozess, bei dem in jedem Schritt gibt es eine Realisierung eines Poisson-Zufallsvariable, diese Erkenntnis gespeichert werden soll, und dann sollte es erkennen die nächsten Poisson-Zufallsvariable und fügen Sie Sie der Summe aller Realisierungen

HPUX machinfo äquivalent für Linux? oder Welche hardware ich verwende?

Anzahl der Antworten 2 Antworten
In HPUX den Befehl "machinfo" - Liste Informationen über die Maschine wie Anzahl der CPUs, CPU-Taktfrequenz, Bus-Geschwindigkeit, Prozessor-Typ, Cache-Informationen, Gesamtgröße des Speicher-und Betriebssystem-Informationen. Gibt es ein äquivalent Linux-Programm? Sollten Sie diese post auf serverfault.com wenn es live

SQL-Befehle aus, um performance-Statistiken

Anzahl der Antworten 3 Antworten
Gibt es SQL-Befehle, die ich verwenden könnte, zu extrahieren performance-monitoring-Daten aus MS SQL 2005, wie: Transaktionen pro Sekunde Seite liest/schreibt verbindungen (@@CONNECTIONS gibt die Summe, aber was ist mit Strom) physische Lesevorgänge locks und blocks andere Indikatoren,

Überwachen der Anzahl der Aufrufe ausgeführt kernel?

Anzahl der Antworten 5 Antworten
Brauche ich, um zu überwachen Betrag von system calls ausgeführt von Linux. Ich bin mir bewusst, dass vmstat hat die Fähigkeit zu zeigen, diese für BSD und AIX-Systemen, aber für Linux kann es nicht (laut man-page). Gibt

Passend Gauß-spezifischen Daten (Suche nach Modell-Parameter)

Anzahl der Antworten 2 Antworten
52.3210481666667 52.3841781666667 52.4938248333333 52.6234071666667 52.9058301666667 53.2846095000000 53.8162295000000 54.4442056666667 55.2349903333333 56.0556786666667 56.9660778333333 57.8731546666667 58.7802311666667 59.6142101666667 60.4249306666667 61.1559080000000 61.7971748333333 62.3387626666667 62.8205433333333 63.2259036666667 63.4950361666667 63.7807816666667 63.9203320000000 64.0964311666667 64.1794968333334 64.2625625000000 64.3323375000000 64.3888223333333 64.5117591666667 64.5017913333333 64.6147606666667 64.6878583333334 64.7476660000000 64.8307311666667 64.9038291666667 65.0334115000000 65.1131545000000

Neuronale Aktivierung Funktionen - Unterschied zwischen Logistik / Tanh / etc

Anzahl der Antworten 4 Antworten
Schreibe ich einige grundlegende neuronale Netzwerk-Methoden - insbesondere die Aktivierung der Funktionen - und geht auf die Grenzen meiner Müll Kenntnisse der Mathematik. Ich verstehe die jeweiligen Bereiche (-1/1) (0/1) etc, aber die unterschiedlichen Beschreibungen und Implementierungen

Die Berechnung des Modus in eine multimodale Liste in Python

Anzahl der Antworten 3 Antworten
Ich versuche zu berechnen, den Modus (häufigsten Wert) der eine Liste von Werten in Python. Ich kam mit einer Lösung, die Gaben die falsche Antwort sowieso, aber dann habe ich gemerkt, dass meine Daten mutlimodal; ie 1,1,2,3,4,4

Gibt es eine API, um Umsatz-Bericht zu Google Play?

Anzahl der Antworten 2 Antworten
Wir haben ein Androïd app auf Google Play, und ich möchte zum abrufen der Umsätze-Bericht programmgesteuert. Apple bietet Autoingestion-tool ermöglicht es eine Java-app, um Sie abzurufen, und es gibt sogar einen Ruby port : https://github.com/siuying/itunes-auto-ingestion Weiß jemand

Grundstück mehrere Sätze von Punkten im R

Anzahl der Antworten 1 Antworten
Habe ich mehrere Sätze von xy-Paaren, die ich zeichnen möchten. Ich möchte jeden Satz von xy-Paaren werden durch eine Linie verbunden. In anderen Worten ist das Ziel, mehrere experimentelle Instanzen jeweils angenähert durch eine Linie geplottet auf

Central Limit Theorem in R

Anzahl der Antworten 2 Antworten
Möchte ich simulieren, central limit theorem, um zu demonstrieren, und ich bin mir nicht sicher, wie es in R. ich will 10.000 Proben mit einer Stichprobengröße von n (kann numerisch sein oder ein parameter), von einer distribution,

Hibernate-Statistiken im Frühjahr Booten nicht funktioniert?

Anzahl der Antworten 2 Antworten
Habe ich eine kleine Beispiel-app hier https://github.com/jimbasilio/SpringBoot schafft einige einfache Daten in der Datenbank und einige andere Dinge, die ich arbeite, kick-die-Reifen auf spring boot (Anmerkung: so weit ich LIEBE den Frühling starten!!). Wenn Sie Klonen Sie

median in R müssen numerische Daten

Anzahl der Antworten 1 Antworten
War ich versucht zu berechnen ist der median der einem gegeben Vektor, aber wenn ich versuchte, ich blieb immer ein Fehler: median(returns) Error in median.default(returns) : need numeric data > returns [1] 0.001262733 -0.005048584 -0.009160197 0.010411955 -0.00542421

R Statistik - memory-Probleme bei der Zuordnung eine große matrix / Linux

Anzahl der Antworten 3 Antworten
Habe ich gelesen, einige threads zu Problemen mit dem Arbeitsspeicher in R, und ich kann nicht scheinen, um herauszufinden, eine Lösung für mein problem. Ich bin mit einer Art LASSO-regression auf mehrere Teilmengen eines großen datasets. Für

Themen remoting perfmon

Anzahl der Antworten 3 Antworten
Hey alle, Ich habe Probleme mit PerfMon auf einem system von den fünfzehn in einer Entwicklungsumgebung. Ein Zugriff von der lokalen Maschine in Ordnung ist, aber die Verbindung zu es aus der Ferne wirft "kann Nicht verbinden"

Wie zu verwenden R ggplot stat_summary zu plot median und Quartile?

Anzahl der Antworten 2 Antworten
so ändern Sie den unteren und oberen Punkt in diesem stat summary plot zu 25% Quartil und 75% Quartil? ggplot(data = diamonds) + stat_summary( mapping = aes(x = cut, y = depth), fun.ymin = min, fun.ymax =

PHP server Statistik script?

Anzahl der Antworten 2 Antworten
Ich bin mir nicht wirklich sicher, wo diese Frage (es ist nicht wirklich webapps oder superuser), aber ich bin mir sicher, dass es etwas ähnliches schon gibt. Ich bin auf der Suche nach einem php-script gibt mir

Da eine Reihe von zufälligen zahlen, die von einer kontinuierlichen univariaten Verteilung, der Verteilung finden

Anzahl der Antworten 6 Antworten
Gegeben sei eine Menge von reellen zahlen, gezeichnet von einer unbekannten continuous univariate Verteilung (sagen wir mal ist eine beta, Cauchy, chi-Quadrat, exponential, F, gamma, Laplace -, log-normal -, normal -, Pareto -, Student -, uniform-und Weibull)

Generieren von log-transformation aller kontinuierlichen Variablen in Stata + Interaktionen

Anzahl der Antworten 1 Antworten
Ich bin versucht zu schreiben foreach Schleife in Stata automatisch generiert log-Transformationen aller kontinuierlichen Variablen in den Datensatz (ausschließen Zeichenfolgen, Binär-Variablen). Der code, den ich versucht habe, die scheint nicht zu funktionieren, ist wie folgt: qui foreach

Wie ich kann ich bedingt ändern Sie die Werte in ein numpy-array unter Berücksichtigung nan zahlen?

Anzahl der Antworten 2 Antworten
Mein array ist ein 2D-matrix-und es hat numpy.nan-Werte neben den negativen und positiven Werte: >>> array array([[ nan, nan, nan, ..., -0.04891211, nan, nan], [ nan, nan, nan, ..., nan, nan, nan], [ nan, nan, nan, ...,

Multi-Kollinearität für Kategoriale Variablen

Anzahl der Antworten 1 Antworten
Für Numerische/Kontinuierliche Daten, um zu erkennen die Kollinearität zwischen den unabhängigen Variablen verwenden wir die Pearson Korrelationskoeffizient und stellen Sie sicher, dass die Prädiktoren nicht miteinander korreliert unter sich, sondern sind in einem Zusammenhang mit der response-Variablen.

Suchen Sie ein Histogramm Binning-Algorithmus für die decimal-Daten

Anzahl der Antworten 2 Antworten
Ich generieren müssen Plätze, für die Zwecke der Berechnung einer Histogramm. Sprache ist C#. Im Prinzip brauche ich, um in einem array von decimal-zahlen und erzeugen ein Histogramm-plot von diesen. Nicht in der Lage zu finden, eine

Wie finden Sie die Standardabweichung s der einfachen linearen regression die Koeffizienten Alpha und Beta in Matlab?

Anzahl der Antworten 3 Antworten
Habe ich Daten und ich muss eine lineare regression auf die Daten zu erhalten y=Alpha*x+Beta Alpha-und Beta-Schätzer gegeben durch die regression, polyfit kann mir keine problem, aber dies ist eine physikalische Wissenschaft Bericht und ich muss zu