Zusammenführen von zwei dataframes, die durch den index

Hallo ich habe folgende dataframes:

> df1
  id begin conditional confidence discoveryTechnique  
0 278    56       false        0.0                  1   
1 421    18       false        0.0                  1 

> df2
   concept 
0  A  
1  B

Wie führe ich auf die Indizes zu bekommen:

  id begin conditional confidence discoveryTechnique   concept 
0 278    56       false        0.0                  1  A 
1 421    18       false        0.0                  1  B

Ich Frage, weil es ist mein Verständnis, dass merge() d.h. df1.merge(df2) Spalten zu tun die passenden. In der Tat, dies zu tun, den ich bekommen:

Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/usr/local/lib/python2.7/dist-packages/pandas/core/frame.py", line 4618, in merge
    copy=copy, indicator=indicator)
  File "/usr/local/lib/python2.7/dist-packages/pandas/tools/merge.py", line 58, in merge
    copy=copy, indicator=indicator)
  File "/usr/local/lib/python2.7/dist-packages/pandas/tools/merge.py", line 491, in __init__
    self._validate_specification()
  File "/usr/local/lib/python2.7/dist-packages/pandas/tools/merge.py", line 812, in _validate_specification
    raise MergeError('No common columns to perform merge on')
pandas.tools.merge.MergeError: No common columns to perform merge on

Ist es schlechte Praxis zu verschmelzen auf den index? Ist es unmöglich? Wenn ja, wie kann ich eine Verschiebung der index in eine neue Spalte namens "index"?

Dank

versuchen Sie dies: df1.join(df2)

InformationsquelleAutor brucezepplin | 2016-11-07

193

Verwenden merge, die inner-join-standardmäßig:

pd.merge(df1, df2, left_index=True, right_index=True)

Oder join, die left-join-standardmäßig:

df1.join(df2)

Oder concat, die outer-join-standardmäßig:

pd.concat([df1, df2], axis=1)

Proben:

df1 = pd.DataFrame({'a':range(6),
                    'b':[5,3,6,9,2,4]}, index=list('abcdef'))

print (df1)
   a  b
a  0  5
b  1  3
c  2  6
d  3  9
e  4  2
f  5  4

df2 = pd.DataFrame({'c':range(4),
                    'd':[10,20,30, 40]}, index=list('abhi'))

print (df2)
   c   d
a  0  10
b  1  20
h  2  30
i  3  40

#default inner join
df3 = pd.merge(df1, df2, left_index=True, right_index=True)
print (df3)
   a  b  c   d
a  0  5  0  10
b  1  3  1  20

#default left join
df4 = df1.join(df2)
print (df4)
   a  b    c     d
a  0  5  0.0  10.0
b  1  3  1.0  20.0
c  2  6  NaN   NaN
d  3  9  NaN   NaN
e  4  2  NaN   NaN
f  5  4  NaN   NaN

#default outer join
df5 = pd.concat([df1, df2], axis=1)
print (df5)
     a    b    c     d
a  0.0  5.0  0.0  10.0
b  1.0  3.0  1.0  20.0
c  2.0  6.0  NaN   NaN
d  3.0  9.0  NaN   NaN
e  4.0  2.0  NaN   NaN
f  5.0  4.0  NaN   NaN
h  NaN  NaN  2.0  30.0
i  NaN  NaN  3.0  40.0

schön. für andere die dies Lesen, wenn es nicht funktioniert, sehen Sie, wenn Sie brauchen, um .transpose() einer Ihrer dfs, um die Synchronisierung der Indizes - das war mein Problem
Vielen Dank. Tolle Antwort. Aber warum macht concat zu setzen df in Klammern, während join und merge nicht?
Liu meiner Meinung nach für möglich concat mehrere DataFrames in der Liste wie dfs = [df1, df2, df3,... dfn] und dann df = pd. concat(dfs)
Schön erklärt.

InformationsquelleAutor jezrael

20

können Sie concat([df1, df2, ...], axis=1), um zu verketten von zwei oder mehr DFs-ausgerichtet von Indizes:
```
pd.concat([df1, df2, df3, ...], axis=1)
```
oder merge für die Verkettung von benutzerdefinierten Feldern /Register:
```
# join by _common_ columns: `col1`, `col3`
pd.merge(df1, df2, on=['col1','col3'])

# join by: `df1.col1 == df2.index`
pd.merge(df1, df2, left_on='col1' right_index=True)
```
oder beitreten für den Beitritt von index:
```
 df1.join(df2)
```
- vielen Dank - die Spalte Spezifikation für die Zusammenführung ist sinnvoll.
InformationsquelleAutor MaxU
2

Einen dummen Fehler, die mir kam: der Verknüpfungen ist fehlgeschlagen, da index dtypes unterschieden. Dies war nicht offensichtlich, wie die beiden Tabellen pivot-Tabellen, die von den gleichen ursprünglichen Tabelle. Nach reset_index, die Indizes sah identisch jupyter. Es kam nur Licht beim speichern in excel...

Feste mit: df1[['key']] = df1[['key']].apply(pd.to_numeric)

Hoffentlich spart sich jemand eine Stunde!!!

InformationsquelleAutor Stephen Morrell
2

Wenn u wollen, an zwei dataframes in pandas einfach können Sie die verfügbaren Attribute wie merge oder concatenate.
Zum Beispiel, wenn ich zwei dataframes df1 und df2 ich können sich Ihnen anzuschließen:
```
newdataframe=merge(df1,df2,left_index=True,right_index=True)
```
InformationsquelleAutor vignesh babu

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.