Immer die r-Quadrat-Wert mit curve_fit

Ich bin ein Anfänger mit den beiden Python und alle seine libs. Aber ich habe es geschafft, ein kleines Programm, das funktioniert wie vorgesehen.
Es nimmt eine Zeichenfolge, zählt das auftreten verschiedener Buchstaben und plottet Sie in einem Diagramm und dann gilt eine Gleichung und Ihre Kurve.
Jetzt würde ich mag, um die r-Quadrat-Wert von der Passform.

Die Allgemeine Idee ist, zu vergleichen verschiedene Arten von text aus Artikel auf verschiedenen Ebenen und zu sehen, wie stark das Allgemeine Muster ist.

Ist nur eine excersise und ich bin die neue, so dass eine leicht verständliche Antwort wäre toll.

Der code ist:

import numpy as np
import math
import matplotlib.pyplot as plt
from matplotlib.pylab import figure, show
from scipy.optimize import curve_fit

s="""det, og deres undersøgelse af hvor meget det bliver brugt viser, at der kun er seks plugins, som benyttes af mere end 5 % af Chrome-brugere.
Problemet med teknologien er, at den ivivuilv rduyd iytf ouyf ouy yg oyuf yd iyt erzypu zhrpyh dfgopaehr poargi ah pargoh ertao gehorg aeophgrpaoghraprbpaenbtibaeriber en af hovedårsagerne til sikkerhedshuller, ustabilitet og deciderede nedbrud af browseren.
Der vil ikke bve lukket for API'et  ivivuilv rduyd iytf ouyf ouy yg oyuf yd iyt erzypu zhrpyh dfgopaehr poargi ah pargoh ertao gehorg aeophgrpaoghraprbpaenbtibaeriber en af hovedårsagerne til sikkerhedshuller, ustabilitet og deciderede nedbrud af browseren.
Der vil ikke blive lukket for API'et på én gang, men det vil blive udfaset i løbet af et års tid. De mest populære plugins får lov at fungere i udfasningsperioden; Det drejer sig om: Silverlight (anvendt af 15 % af Chrome-brugere sidste måned), Unity (9,1 %), Google Earth (9,1 %), Java (8,9%), Google Talk (8,7 %) og Facebook Video (6,0 %).
Det er muligt at hvidliste andre plugins, men i slutningen af 2014 forventer udviklerne helt at lukke for brugen af dem."""
fordel=[]
alf=['a','b','c','d','e','f','g','h','i','j','k','l','m','n','o','p','q','r','s','t','u','v','w','x','y','z','æ','ø','å']
i=1
p=0
fig = figure()
ax1 = fig.add_subplot(1,2,0)
for i in range(len(alf)):
    fordel.append(s.count(alf[i]))
    i=i+1   
fordel=sorted(fordel,key=int,reverse=True)
yFit=fordel
xFit=[0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28]
def func(x, a, b):
    return a * (b ** x)
popt, pcov = curve_fit(func, xFit, yFit)
t = np.arange(0.0, 30.0, 0.1)
a=popt[0]
b=popt[1]
s = (a*b**t)
ax1.plot(t,s)
print(popt)
yMax=math.ceil(fordel[0]+5)
ax1.axis([0,30,0,yMax])
for i in range(0,int(len(alf))*2,2):
    fordel.insert(i,p)
    p=p+1
for i in range(0,int(len(fordel)/2)):
    ax1.scatter(fordel[0],fordel[1])
    fordel.pop(0)
    fordel.pop(0)
plt.show()
show()

InformationsquelleAutor Mathias | 2013-10-04

42

Computing $Immer die r-Quadrat-Wert mit curve_fit$ :

Den $Immer die r-Quadrat-Wert mit curve_fit$ ). Jede ist definiert als:

$Immer die r-Quadrat-Wert mit curve_fit$

$Immer die r-Quadrat-Wert mit curve_fit$

$Immer die r-Quadrat-Wert mit curve_fit$

$Immer die r-Quadrat-Wert mit curve_fit$

wo . Entnommen aus Wikipedia.

Von scipy.optimize.curve_fit():
- Können Sie die Parameter (popt) von curve_fit() mit
  
  popt, pcov = curve_fit(f, xdata, ydata)
- Können Sie die restliche Summe der Quadrate () mit
  - residuals = ydata- f(xdata, popt)
  - ss_res = numpy.sum(residuals**2)
- Können Sie die Summe der Quadrate ( $Immer die r-Quadrat-Wert mit curve_fit$ ) mit
  
  ss_tot = numpy.sum((ydata-numpy.mean(ydata))**2)
- Und schließlich die $Immer die r-Quadrat-Wert mit curve_fit$ -Wert mit,
  
  r_squared = 1 - (ss_res /ss_tot)
- OFC! Brillante Antwort. Für einige Grund, warum ich nicht betrachten gerade Berechnung es mich, obwohl es scheint ziemlich geradlinig. Danke.
- zwei Fragen: 1. sollte nicht popt mit ersetzt werden *popt im restlichen Gleichung? 2. warum nicht mit pcov?
InformationsquelleAutor wingr

Ich denke diese Methode ist ein einfacher Weg, um zu lösen das problem minimieren:

res = minimize(func)  # your optimize function
cof = np.reshape(np.array(res.x),(-1,1))
r_square = 1.0 - (np.var(ydata-xdata.dot(cof)) / np.var(ydata))

# or 
# r_square = 1 - np.square(ydata-xdata.dot(cof)).sum() /(np.var(ydata) * len(ydata))

InformationsquelleAutor mutex86

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.