numpy corrcoef - compute correlation matrix, während die fehlenden Daten zu ignorieren

Ich versuche zur Berechnung einer Korrelationsmatrix mehrerer Werte. Diese Werte beinhalten einige 'nan' - Werte. Ich bin mit numpy.corrcoef. Für das element(i,j) des Ausgangs-Korrelationsmatrix, würde ich gerne die Korrelation errechnet, indem alle Werte, die es für die beiden Variablen i und der Variablen j.

Dies ist, was ich jetzt habe:

In[20]: df_counties = pd.read_sql("SELECT Median_Age, Rpercent_2008, overall_LS, population_density FROM countyVotingSM2", db_eng)
In[21]: np.corrcoef(df_counties, rowvar = False)
Out[21]: 
array([[ 1.        ,         nan,         nan, -0.10998411],
       [        nan,         nan,         nan,         nan],
       [        nan,         nan,         nan,         nan],
       [-0.10998411,         nan,         nan,  1.        ]])

Zu viele nan ' s 🙁

InformationsquelleAutor Selah | 2015-07-24
Schreibe einen Kommentar