Tag: regression
Regressionsanalyse ist eine Sammlung von statistischen Techniken für die Modellierung und die Vorhersage einer oder mehrerer Variablen in Abhängigkeit von anderen Daten.
1
Antworten
Noch Recht neu auf R (und Statistiken, um ehrlich zu sein) und ich habe derzeit nur verwendet es für die einfache lineare regression-Modelle. Aber jetzt hat meine Daten-sets eindeutig zeigt eine invertierte U-Muster. Ich glaube, ich habe
1
Antworten
Ich versuche mit einem einfachen least-squares-regression in R und haben sich Fehler ständig. Das ist wirklich frustrierend, kann mir jemand erklären, was ich falsch mache? Zuerst lege ich den Datensatz (17 Variablen, 440 Beobachtungen, jede Beobachtung auf
1
Antworten
Gibt es 2 Arten von Verallgemeinerten Linearen Modellen: 1. Log-Lineare Regression, auch bekannt als Poisson-Regression 2. Logistische Regression Wie die Umsetzung der Poisson-Regression in Python für die Preis-Elastizität Vorhersage? Ist dies etwas, was du suchst, statsmodels.sourceforge.net/devel/glm.html? Auch,
3
Antworten
Ich bin ein R-Neuling, aber ich bin auf der Suche nach einem Weg, um zu bestimmen, die drei Parameter A, B und C verwandt sind, indem Sie die folgende Funktion in R: y = A * (x1^B)
7
Antworten
Bin ich passend ein Modell, um den Faktor von Daten und voraussagen. Wenn die newdata im predict.lm() enthält einen einzigen Faktor-Ebene, ist unbekannt, das Modell, die alle von predict.lm() schlägt fehl und gibt einen Fehler zurück. Ist
2
Antworten
Lief ich eine regression: CopierDataRegression <- lm(V1~V2, data=CopierData1) und meine Aufgabe war die Erlangung eines 90% Konfidenzintervall für die mittlere Antwort gegeben V2=6 und 90% Vorhersage-Intervall wenn V2=6. Ich verwendete den folgenden code: X6 <- data.frame(V2=6) predict(CopierDataRegression,
1
Antworten
Werde ich ein Programm schreiben, wo der Eingang ist ein Daten-set mit der 2D-Punkte und die Ausgabe der Regressionskoeffizienten der Linie der besten Passform durch die Minimierung der minimale MSE-Fehler. Habe ich einige Beispiel-Punkte, die ich möchte-Prozess:
5
Antworten
Arbeite ich an einer desktop-Anwendung, die verwendet Infragistic Netze. Wir müssen die Automatisierung des Regressionstests. QTP allein dies nicht unterstützt, müssen wir kaufen neue plug-ins für die gleiche, die meine Firma ist nicht sehr viel interessiert. Haben
3
Antworten
Ich weiß, es gibt einen kleinen Unterschied zwischen $sigma und das Konzept der root mean squared error. Also, ich Frage mich, was ist der einfachste Weg, um RMSE aus lm Funktion in R? res<-lm(randomData$price ~randomData$carat+ randomData$cut+randomData$color+ randomData$clarity+randomData$depth+
3
Antworten
Wenn ich eine regression in R und Typ-Faktor, es hilft mir zu vermeiden, bis der kategorischen Variablen in den Daten. Aber wie Entferne ich ein Faktor, der nicht signifikant von der regression nur zeigen signifikante Variablen? Beispiel:
1
Antworten
Ich bin ein Anfänger in R. Hier ist ein sehr einfacher code, wo ich versuche zu speichern, die Restlaufzeit: # Create variables for child's EA: dat$cldeacdi <- rowMeans(dat[,c('cdcresp', 'cdcinv')],na.rm=T) dat$cldeacu <- rowMeans(dat[,c('cucresp', 'cucinv')],na.rm=T) # Create a residual
2
Antworten
Möchte ich zur Bewertung einer regression Modell erstellen, mit scikitlearn mit der Kreuzvalidierung und immer verwirrt, welche der beiden Funktionen cross_val_score und cross_val_predict ich verwenden soll. Eine Möglichkeit wäre : cvs = DecisionTreeRegressor(max_depth = depth) scores =
3
Antworten
Bin ich mit dem WACHSTUM (oder TREND oder RGP oder RKP, alle machen das gleiche Problem) - Funktion in Excel 2003. Aber es gibt ein problem, dass, wenn einige Daten fehlen, wird die Funktion verweigert, Ergebnis: Können
1
Antworten
Ich versuche mit diesem code-snippet. Ich bin mit scikits.lernen 0.8.1 from scikits.learn import linear_model import numpy as np num_rows = 10000 X = np.zeros([num_rows,2]) y = np.zeros([num_rows,1]) # assume here I have filled in X and y
1
Antworten
Habe ich versucht das setup eine nicht-lineare regression problem in Keras. Leider, die Ergebnisse zeigen, dass overfitting Auftritt. Hier ist der code, model = Sequential() model.add(Dense(number_of_neurons, input_dim=X_train.shape[1], activation='relu', kernel_regularizer=regularizers.l2(0))) model.add(Dense(int(number_of_neurons), activation = 'relu', kernel_regularizer=regularizers.l2(0))) model.add(Dense(int(number_of_neurons), activation='relu', kernel_regularizer=regularizers.l2(0)))
1
Antworten
Gegeben, zwei einfache Sätze von Daten: head(training_set) x y 1 1 2.167512 2 2 4.684017 3 3 3.702477 4 4 9.417312 5 5 9.424831 6 6 13.090983 head(test_set) x y 1 1 2.068663 2 2 4.162103 3
1
Antworten
Ich möchte plot eine Logistische regression Kurve meiner Daten, aber immer wenn ich versuche auf meinem Grundstück produziert mehrere Kurven. Hier ist ein Bild von meinem letzten Versuch: letzter Versuch Hier ist der relevante code, den ich
1
Antworten
Ich bin mit eine Logistische regression in R und tun "backward elimination" inorder, um meine endgültige Modell: FulMod2 <- glm(surv~as.factor(tdate)+as.factor(tdate)+as.factor(sline)+as.factor(pgf) +as.factor(weight5)+as.factor(backfat5)+as.factor(srect2) +as.factor(bcs)+as.factor(loco3)+as.factor(fear3) +as.factor(teats)+as.factor(preudder)+as.factor(postudder) +as.factor(colos)+as.factor(tb5) +as.factor(respon3) +as.factor(feed5)+as.factor(bwt5)+as.factor(sex) +as.factor(fos2)+as.factor(gest3)+as.factor(int3), family=binomial(link="logit"),data=sof) Beim ausführen der rückwärts-elimination-Skript: step(FulMod2,direction="backward",trace=FALSE) Habe ich diese Fehlermeldung:
2
Antworten
Ich habe versucht, auf der Suche die anderen threads zu diesem Thema, aber keiner der fixes arbeiten für mich. Ich habe die Ergebnisse von einem natürlichen experiment, und ich möchte, um die Anzahl der aufeinander folgenden vorkommen
2
Antworten
Will ich tun, schrittweise regression mit AIC auf eine Liste von linearen Modellen. Idee ist, e eine Liste von linearen Modelle und wenden Sie dann die stepAIC auf jedes element in der Liste. Es fehlschlägt. Hallo Leute
1
Antworten
Bin ich Plotten das vorkommen von Arten nach zahlreichen Variablen auf dem gleichen Grundstück. Es gibt viele andere Variablen, aber ich habe nur immer die wichtigsten für die Zwecke dieser post: > str(GH) 'data.frame': 288 obs. of
2
Antworten
Ich bin beschäftigt mit einem Regressionsmodell in R, und ich habe über 16 000 Beobachtungen. Eine dieser Beobachtungen mich veranlasst, die folgenden Fehlermeldung erhalten, (1 observation deleted due to missingness) Gibt es eine Möglichkeit in R so,
1
Antworten
Ich Frage mich, ob es einen Weg gibt, um auch Fehler-Bedingungen für eine lineare regression Modell: r = lm(y ~ x1+x2) Was meinst du mit Fehler? Ihr code wird passen die folgenden linearen Modells: y = a
1
Antworten
Ok, ich habe auf der Suche nach einer Funktion, die mir hilft, ändern Sie die Größe meiner Regressionsgerade in xyplot. Ich habe versucht panel.abline(reg = coef, size = 2) aber es funktioniert nicht. Hören ist mein code,
1
Antworten
versuche zu laufen logit-regression für Deutsche credit-Daten (www4.stat.ncsu.edu/~boos/var.select/german.credit.html). Um den code zu testen, habe ich verwendet nur numerische Variablen und versucht entziehender es mit das Ergebnis mit dem folgenden code. import pandas as pd import statsmodels.api as
2
Antworten
Ich bin mit einer regression, die auf Daten der Volkszählung, wo meine abhängige variable ist die Lebenserwartung, und ich habe acht unabhängigen Variablen. Die Daten aggregiert werden Städte, so habe ich viele tausend Beobachtungen. Mein Modell ist
1
Antworten
Ich möchte, um eine Darstellung der Ergebnisse der multivariaten logistischen Regressionsanalyse (GLM) für einen bestimmten unabhängigen Variablen bereinigt (d.h. unabhängig von der confounder in das Modell aufgenommen) Zusammenhang mit dem Ergebnis (Binär). Habe ich Nachrichten gefunden, die
2
Antworten
Ich bin versucht durchzuführen, lasso-regression, die mit der lars-Paket, aber kann nicht scheinen, um Holen Sie sich die lars-bit arbeiten. Ich habe eingegeben code: diabetes<-read.table("diabetes.txt", header=TRUE) diabetes library(lars) diabetes.lasso = lars(diabetes$x, diabetes$y, type = "lasso") Allerdings bekomme
1
Antworten
Möchte ich eine regression von y~x (nur 1 abhängige und 1 unabhängige variable), aber ich habe heteroskedasticity. Die Variabilität von y erhöht, da x erhöht. Um damit umzugehen, ich möchte mit gewichteten kleinsten Quadrate durch die "gls()"
2
Antworten
So, ich bin versucht, zwei Modelle vergleichen, fit1 und fit2. Erst war ich nur tun anova(fit1,fit2), und dort ergab sich eine Ausgabe, die ich verstanden habe (darunter ein p-Wert). Jedoch, wenn ich wechselte meine Modelle von lm()-based
1
Antworten
Ich bin mit der logistischen regression in R (glm). Ich habe dann verwalten zu Plotten das Ergebnis. Mein code ist wie folgt: temperature.glm = glm(Response~Temperature, data=mydata,family=binomial) plot(mydata$Temperature,mydata$Response, ,xlab="Temperature",ylab="Probability of Response") curve(predict(temperature.glm,data.frame(Temperature=x),type="resp"),add=TRUE, col="red") points(mydata$Temperature,fitted(temperature.glm),pch=20) title(main="Response-Temperature with Fitted GLM
2
Antworten
Ich bin derzeit mit scipy ist linregress-Funktion für Einzel-regression. Ich bin nicht in der Lage zu finden, wenn die gleiche Bibliothek, oder andere, in der Lage ist zu tun, multiple regression, abhängige variable und mehr als eine
4
Antworten
In Excel, die ziemlich einfach zu passen, wird eine logarithmische Trendlinie, die von einem gegebenen Satz von trend line. Klicken Sie einfach auf Trendlinie hinzufügen und dann wählen Sie "Logarithmisch"." Der Wechsel zu R für mehr power,
1
Antworten
Ich verstehe nicht ganz, was der p-Wert in dieser Ausgabe bedeutet. Ich meine nicht die p-Werte als solche, aber in diesem Fall. > Model 1: sl ~ le + ky > Model 2: sl ~ le Res.Df
3
Antworten
Problem Kontext Mit scikit-learn mit Python, ich versuche, passen eine quadratische Polynom-Kurve, um einen Satz von Daten, so dass das Modell wäre von der form y = a2x^2 + a1x + a0 und die an Koeffizienten werden
5
Antworten
Weiss einer eine einfache Möglichkeit, um Stata zum anzeigen von mehr als nur drei Ziffern für den p-Wert beim ausführen einer Tobit-regression? Normalerweise Stata berichtet, dass der p-Wert ist .001 oder .065, aber ich würde gerne sehen,
2
Antworten
Merke ich, dass es Beiträge zum Thema B-Splines auf diesem board, aber die haben eigentlich hat mich mehr verwirrt, so dass ich dachte, jemand könnte in der Lage sein, mir zu helfen. Ich habe simulierten Daten für
2
Antworten
Ich versuche, führen Sie eine nichtlineare multiple regression in R mit einem Datensatz, es hat Tausende von Zeilen, so dass ich werde einfach die ersten paar hier: Header.1 Header.2 Header.3 Header.4 Header.5 Header.6 Header.7 1 -60 -45
4
Antworten
Da eine Reihe von Punkten, was ist der Schnellste Weg, um fit einer Parabel? Tut Sie das least-squares-Berechnung oder ist es ein iterativer Weg? Dank Bearbeiten: Ich denke, Gradienten-Abstieg ist der Weg zu gehen. Least-squares-Berechnung hätte ein
2
Antworten
Ich habe Daten auf die Einnahmen eines Unternehmens aus dem Verkauf von verschiedenen Produkten (csv-Dateien), von denen einer aussieht wie der folgende: > abc Order.Week..BV. Product.Number Quantity Net.ASP Net.Price 1 2013-W44 ABCDEF 92 823.66 749 2 2013-W44
1
Antworten
Ich habe den folgenden code für die Minimierung der Summe der Abweichungen mithilfe von optim() zu finden, beta0 und beta1 aber ich erhalte den folgenden Fehler, ich bin nicht sicher, was ich falsch mache: sum.abs.dev<-function(beta=c(beta0,beta1),a,b) { total<-0
3
Antworten
Ich habe eine multiple regression-Modell. Ich möchte hinzufügen, die ausgestattet Werte und Residuen der ursprünglichen data.frame als zwei neue Spalten. Wie kann ich das erreichen? Mein Modell in R wie folgt ist: BD_lm <- lm(y ~ x1+x2+x3+x4+x5+x6,
2
Antworten
Ich habe lm() passen multiple regression-Modelle, für mehrere (~1 Mio) response-Variablen in R. Eg. allModels <- lm(t(responseVariablesMatrix ~ modelMatrix) Diese gibt ein Objekt der Klasse "mlm", und das ist wie ein riesiges Objekt mit allen Modellen. Ich
2
Antworten
Ich versuche die Residuen für das Streudiagramm der beiden Variablen. Ich könnte das least-squares linear regression line mit lsline - Funktion von matlab. Jedoch möchte ich, um die Residuen als gut. Wie kann ich diese in matlab.
3
Antworten
Ich bin mit der ols.py code heruntergeladen scipy Kochbuch (der download ist im ersten Absatz mit der Fett-OLS), aber ich brauche, um zu verstehen, eher als die Verwendung von zufälligen Daten für die ols-Funktion zu tun, die
3
Antworten
Lief ich eine multiple regression mit mehreren kontinuierliche Prädiktoren, von denen einige kam sich bedeutend, und ich möchte ein scatterplot-oder scatter-wie plot von meiner DV gegen eine der Prädiktoren, darunter eine "Regressionsgerade". Wie kann ich dies tun?
1
Antworten
Ich versuche, vorherzusagen, die zugeben, variable Prädiktoren wie gre,gpa und Reihen.Aber die Vorhersage-Genauigkeit ist sehr weniger(0.66).Das dataset wird unten gegeben. https://gist.github.com/abyalias/3de80ab7fb93dcecc565cee21bd9501a Bitte einen der folgenden codes: In[73]: data.head(20) Out[73]: admit gre gpa rank_2 rank_3 rank_4 0 0
1
Antworten
Ich würde gerne erzeugen ein Streudiagramm von ein Pandas dataframe mit dem folgenden code: df.plot.scatter(x='one', y='two, title='Scatterplot') Gibt es einen Parameter, die ich senden kann mit der Aussage, es zeigt eine regressionslinie und zeigt die Parameter der
5
Antworten
Die curve-fitting-problem für 2D-Daten ist bekannt (LOWESS, etc.) aber da eine Reihe von 3D-Daten Punkte, wie passe ich ein 3D-Kurve (zB. eine Glättung/regression spline) auf diese Daten? MEHR: ich versuche zu finden, eine Kurve, passend für die
3
Antworten
Ich bin neu auf der Maschine lernen, und ich bin versucht zu behandeln Keras zum durchführen von regression-Aufgaben. Ich habe Erfahrung in diesem code, basierend auf diese Beispiel. X = df[['full_sq','floor','build_year','num_room','sub_area_2','sub_area_3','state_2.0','state_3.0','state_4.0']] y = df['price_doc'] X = np.asarray(X)