Mit scikit-learn LinearRegression in den plot ein linearer fit

Ich versuche, lineares Regressionsmodell für die Vorhersage der Sohn die Länge seines Vaters, Länge

import numpy as np
import pandas as pd
from matplotlib import pyplot as plt
import seaborn as sns
%matplotlib inline
from sklearn.linear_model import LinearRegression


Headings_cols = ['Father', 'Son']
df = pd.read_csv('http://www.math.uah.edu/stat/data/Pearson.txt', 
                 delim_whitespace=True, names=Headings_cols)



X = df['Father']  
y = df['Son']  

model2 = LinearRegression()
model2.fit(y, X)

plt.scatter(X, y,color='g')
plt.plot(X, model.predict(X),color='g')

plt.scatter(y, X, color='r')
plt.plot(y, X, color='r')

Bekomme ich Fehler

ValueError: could not convert string to float: 'Father'

Die zweite Sache ist die Berechnung der durchschnittlichen Länge der Söhne, und der Standardfehler des Mittelwertes ?

  • In welcher Codezeile bekommst du den Fehler?
  • X = df['Vater'] y = df ["Sohn"]
InformationsquelleAutor | 2016-12-02
Schreibe einen Kommentar