Fügen Sie eine Spalte in dataframe aus der Liste

Ich habe einen dataframe mit einigen Spalten, wie diese:

Den die mögliche Bandbreite der Werte in Einer nur von 0 bis 7.

Außerdem habe ich eine Liste von 8 Elementen wie diese:

List=[2,5,6,8,12,16,26,32]  //There are only 8 elements in this list

Wenn das element in Spalte A ist n, die ich einfügen muss die n te element aus der Liste in einer neuen Spalte, sagen Sie 'D'.

Wie kann ich das in einem Rutsch, ohne Schleifen über die ganze dataframe?

Den daraus resultierenden dataframe würde wie folgt Aussehen:

A   B   C   D
0           2
4           12
5           16
6           26
7           32
7           32
6           26
5           16

Hinweis: Der dataframe ist riesig und die iteration ist die Letzte option. Aber ich kann auch ordnen Sie die Elemente in 'Listen' in anderen Datenstruktur, wie dict, wenn nötig.

Ich denke, man braucht eine (kleinere) Spielzeug-Beispiel, mit dem gewünschten Ergebnis. Es klingt ein wenig vage atm.
Nie rufen wir die variable "Liste". In jeder Sprache.

InformationsquelleAutor mane | 2014-10-31

34

IIUC, wenn du deine (leider den Namen) List in eine ndarray können Sie einfach einen index in es natürlich.
```
>>> import numpy as np
>>> m = np.arange(16)*10
>>> m[df.A]
array([  0,  40,  50,  60, 150, 150, 140, 130])
>>> df["D"] = m[df.A]
>>> df
    A   B   C    D
0   0 NaN NaN    0
1   4 NaN NaN   40
2   5 NaN NaN   50
3   6 NaN NaN   60
4  15 NaN NaN  150
5  15 NaN NaN  150
6  14 NaN NaN  140
7  13 NaN NaN  130
```
Hier baute ich eine neue m aber wenn Sie mit m = np.asarray(List), die gleiche Sache arbeiten sollten: die Werte in df.A wird, wählen Sie die entsprechenden Elemente der m.

Beachten Sie, dass wenn Sie verwenden eine alte version von numpy haben, haben Sie möglicherweise verwenden m[df.A.values] statt-in der Vergangenheit numpy nicht gut mit anderen spielen, und einige refactoring in pandas verursachte einige Kopfschmerzen. Die Dinge haben sich verbessert.
- Hi @DSM. Ich bekomme, was du sagst, aber ich bin immer diese Fehlermeldung: Traceback (most recent call last): File "./b.py", line 24, in <module> d["D"] = m[d.A] IndexError: unsupported iterator index
- urf, das ist eine alte numpy bug. Tut d["D"] = m[d.A.values] für Sie arbeiten?
- Genial! " d["D"] = m[d....Ein.Werte]` funktioniert!!! Vielen Dank!
InformationsquelleAutor DSM
191

Weisen Sie einfach die Liste direkt:
```
df['new_col'] = mylist
```
Alternative

Konvertieren Sie die Liste in eine Reihe oder ein array und weisen:
```
se = pd.Series(mylist)
df['new_col'] = se.values
```
oder
```
df['new_col'] = np.array(mylist)
```
- Sie die real OG. Das war einfach super und genau das was ich gebraucht habe
- Dies ist, was genau das problem lösen.
- pykernel_launcher.py:1: SettingWithCopyWarning: A value is trying to be set on a copy of a slice from a DataFrame. Try using .loc[row_indexer,col_indexer] = value instead See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy """Entry point for launching an IPython kernel.
- wird mit pd.Series Effekt der "dtype"? Ich meine, wird es verlassen, schwebt als schwimmt und die strings als strings? Oder werden die Elemente in der Liste werden standardmäßig auf Streicher?
- es ist ein false positiv, das kann in diesem Fall ignoriert. Für mehr info: stackoverflow.com/questions/20625582/...
- Dies kann vereinfacht werden zu: df['new_col'] = pd.Serie(mylist).Werte
InformationsquelleAutor sparrow
10

Lösung Verbesserung auf der große einer von @sparrow.

Lassen df, dein dataset, und mylist die Liste mit den Werten, die Sie hinzufügen möchten, dataframe.

Nehmen wir an, Sie möchten rufen Sie Ihren neuen Spalte einfach, new_column

Zuerst die Liste in eine Reihe:
```
column_values = pd.Series(mylist)
```
Dann verwenden Sie die einfügen - Funktion, um die Spalte hinzuzufügen. Diese Funktion hat den Vorteil, um Sie wählen zu lassen, in welcher Lage Sie möchten Platz der Spalte.
Im folgenden Beispiel werden wir die position der neuen Spalte in der ersten Stellung von Links (der Parameter loc=0)
```
df.insert(loc=0, column='new_column', value=column_values)
```
- Das wird nicht funktionieren, wenn Sie verändert Ihre Indizes von df auf etwas anderes dann 1,2,3..., in diesem Fall müssen Sie zwischen den Zeilen: column_values.index=df.index
InformationsquelleAutor Salvatore Cosentino
8

Zuerst erstellen wir den dataframe, die Sie hatten, werde ich ignorieren Sie die Spalten B und C, da Sie nicht relevant sind.
```
df = pd.DataFrame({'A': [0, 4, 5, 6, 7, 7, 6,5]})
```
Und die Zuordnung aus, die Sie sich wünschen:
```
mapping = dict(enumerate([2,5,6,8,12,16,26,32]))

df['D'] = df['A'].map(mapping)
```
Getan!
```
print df
```
Ausgabe:
```
   A   D
0  0   2
1  4  12
2  5  16
3  6  26
4  7  32
5  7  32
6  6  26
7  5  16
```
- Ich denke, der OP weiß, wie man dies bereits. Durch mein Lesen, das Problem ist der Bau D aus den Elementen der A und List ("Wenn das element in Spalte A ein n ist, muss ich einfügen das n-te element aus der Liste in einer neuen Spalte, sagen Sie 'D'.")
- SO hat sich in eine Art von F(*& nanny-Staat. Dank @DSM für den Kommentar, aber ich konnte auch nicht die richtige post, bis es wurde peer-reviewed. und dann wurde es abgelehnt, weil es zu schnell war. und dann war ich in der Lage, peer-review, meine eigenen zu Bearbeiten. und dann ist es zu spät, weil ein schlechter (IMHO) Antwort war "angenommen". SO wirklich bekam einige meta-nanny, die sind weniger als hilfreich!!!!!!
- Gut, ich kann nicht sprechen für die Kindermädchen, aber Sie werden feststellen, dass Ihr Ansatz ist etwa eine Größenordnung langsamer, auf lange arrays. Im übrigen, natürlich, die Wahl zwischen np.array(List)[df.A] und df["A"].map(dict(enumerate(List))) ist vor allem eine Frage der Präferenz.
- Hallo Phil, ich sah nur Ihre Lösung und DSM Kommentar und dann nie wieder, da der DSM-Lösung funktionierte gut für mich. Aber jetzt nach deiner Lösung funktioniert es auch. Ich habe die DSM-Lösung auf meinem dataset von ungefähr 200k Einträge und es läuft in ein paar Sekunden mit allen anderen Berechnungen, die ich habe. Ich bin ganz neu bei python-pandas und persönlich war nicht auf der Suche nach etwas elegant oder groß; was auch immer gearbeitet, war in Ordnung. Aber ehrlich, vielen Dank für die Lösung.
InformationsquelleAutor Phil Cooper

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.