Python-numpy: erstellen von 2d-array von Werten basierend auf Koordinaten

Ich habe eine Datei mit 3 Spalten, wobei die ersten beiden Koordinaten (x,y) und der Dritte ist ein Wert (z) entsprechenden position. Hier ein kurzes Beispiel:

Ich möchte ein 2D-array mit Werten aus der Dritten Reihe, basierend auf deren x -, y-Koordinaten in der Datei. Ich lese in jeder Spalte als einen einzelnen array, und ich erstellte raster der x-Werte und y-Werte mithilfe von numpy.meshgrid, wie diese:

x = [[0 1 2]    and   y = [[0 0 0]
     [0 1 2]               [1 1 1]
     [0 1 2]]              [2 2 2]]

aber ich bin neu in Python und weiß nicht, wie um eine Dritte zu erzeugen grid Werte von z, die wie folgt aussieht:

z = [[Nan 15 Nan]
     [14  16  18]
     [17  Nan 13]]

Ersetzen Nan mit 0 wäre in Ordnung, zu, mein Haupt-problem ist die Erstellung der 2D-array in den ersten Platz. Vielen Dank im Voraus für Eure Hilfe!

Ich konnte nicht verstehen, was ist die erwartete Funktionalität hier.

InformationsquelleAutor Aero | 2015-06-10

26

Vorausgesetzt, die x und y Werte in Ihrer Datei direkt entsprechen Indizes (wie in deinem Beispiel), Sie können tun, etwas ähnliches wie das hier:
```
import numpy as np

x = [0, 0, 1, 1, 2, 2]
y = [1, 2, 0, 1, 1, 2]
z = [14, 17, 15, 16, 18, 13]

z_array = np.nan * np.empty((3,3))
z_array[y, x] = z

print z_array
```
Welche ergibt:
```
[[ nan  15.  nan]
 [ 14.  16.  18.]
 [ 17.  nan  13.]]
```
Für große arrays, das wird viel schneller als die explizite Schleife über die Koordinaten.

Umgang mit non-uniform x & y-Eingang

Wenn Sie regelmäßig beprobt x & y Punkte, dann können Sie konvertieren Sie raster-Indizes, indem man die "Ecke" von Ihrem Netz (dh x0 und y0), dividiert durch den Zellenabstand, Guss-und als int-Werte. Sie können dann die oben genannte Methode nutzen oder in einer der anderen Antworten.

Als ein Allgemeines Beispiel:
```
i = ((y - y0) / dy).astype(int)
j = ((x - x0) / dx).astype(int)

grid[i,j] = z
```
Allerdings gibt es ein paar tricks, die Sie verwenden können, wenn Ihre Daten nicht in regelmäßigen Abständen.

Lassen Sie uns sagen, dass wir die folgenden Daten:
```
import numpy as np
import matplotlib.pyplot as plt

np.random.seed(1977)
x, y, z = np.random.random((3, 10))

fig, ax = plt.subplots()
scat = ax.scatter(x, y, c=z, s=200)
fig.colorbar(scat)
ax.margins(0.05)
```
Wollen wir in regelmäßigen 10x10 raster:

Können wir tatsächlich nutzen/Missbrauch np.histogram2d für diese. Statt zählt, wir müssen es hinzufügen, den Wert für jeden Punkt, der fällt in eine Zelle. Es ist am einfachsten, dies durch die Angabe weights=z, normed=False.
```
import numpy as np
import matplotlib.pyplot as plt

np.random.seed(1977)
x, y, z = np.random.random((3, 10))

# Bin the data onto a 10x10 grid
# Have to reverse x & y due to row-first indexing
zi, yi, xi = np.histogram2d(y, x, bins=(10,10), weights=z, normed=False)
zi = np.ma.masked_equal(zi, 0)

fig, ax = plt.subplots()
ax.pcolormesh(xi, yi, zi, edgecolors='black')
scat = ax.scatter(x, y, c=z, s=200)
fig.colorbar(scat)
ax.margins(0.05)

plt.show()
```
Jedoch, wenn wir eine große Anzahl von Punkten, einige Behälter mehr als einen Punkt. Die weights argument np.histogram einfach fügt die Werte. Das ist wahrscheinlich nicht das, was Sie wollen, in diesem Fall. Dennoch, können wir den Mittelwert der Punkte, die fallen, die in jeder Zelle durch Teilung durch den Grafen.

So, zum Beispiel, sagen wir, wir haben 50 Punkte:
```
import numpy as np
import matplotlib.pyplot as plt

np.random.seed(1977)
x, y, z = np.random.random((3, 50))

# Bin the data onto a 10x10 grid
# Have to reverse x & y due to row-first indexing
zi, yi, xi = np.histogram2d(y, x, bins=(10,10), weights=z, normed=False)
counts, _, _ = np.histogram2d(y, x, bins=(10,10))

zi = zi / counts
zi = np.ma.masked_invalid(zi)

fig, ax = plt.subplots()
ax.pcolormesh(xi, yi, zi, edgecolors='black')
scat = ax.scatter(x, y, c=z, s=200)
fig.colorbar(scat)
ax.margins(0.05)

plt.show()
```
Mit einer sehr großen Anzahl von Punkten, das genaue Methode werden langsam (und kann beschleunigt werden leicht), aber es reicht für etwas weniger als ~1e6 Punkte.
- Leider ist mein x und y Werten eigentlich gar nicht entsprechen Indizes. Ich glaube, das war eine schlechte Wahl der Beispiel! Stattdessen, Sie sind ein bisschen zufällig, wie 27 31 14 für meine erste Zeile in der Datei.
- Wenn x und y sind nicht Indizes wie ist das 2d-array von z-Werten definiert?
- Sie haben zu definieren, die Ausdehnung und Zellengröße des Gitters nach außen. In diesem Beispiel ist der min/max-Daten mit einem 10x10 Gitter dazwischen. Jedoch, diese Art von "Gruppierung" die Daten sind sehr oft für die späteren diskrete Analyse. In diesem Fall werden Sie bin die Daten auf einige bereits vorhandene raster-oder bin es auf das raster, das Sie verwenden werden für den rest der Analyse.
- ausgezeichnete Antwort, ich mochte die Histogramm-Methode. Gibt es einen ähnlichen trick wie im Fall von n-dimensionalen Daten?
- Sie können den gleichen trick mit np.histogramdd für den n-dimensionalen Fall, soweit ich weiß. Werden Sie sich bewusst von den früheren Nachteil der Geschwindigkeit, obwohl. Es kann langsamer mit hochdimensionalen Datensätzen.
- Hallo, können Sie mir bitte helfen mit diesem stackoverflow.com/questions/45200428/... ich bin in der Hoffnung zu verwenden, np.meshgrid () - Funktion und scipy.interpolieren.griddata (), so dass ich mich identifizieren konnte jeder Zelle(i,j) koordinieren, und jedes segment in einer Zelle können einige eindeutige id
InformationsquelleAutor Joe Kington

Kezzos mich zu schlagen, aber ich hatte einen ähnlichen Ansatz,

x = np.array([0,0,1,1,2,2])
y = np.array([1,2,0,1,1,2])
z = np.array([14,17,15,16,18,13])
Z = np.zeros((3,3))
for i,j in enumerate(zip(x,y)): 
    Z[j] = z[i]

Z[np.where(Z==0)] = np.nan

InformationsquelleAutor Dave

Könnten Sie versuchen, so etwas wie:

import numpy as np

x = [0, 0, 1, 1, 2, 2]
y = [1, 2, 0, 1, 1, 2]
z = [14, 17, 15, 16, 18, 13]

arr = np.zeros((3,3))
yx = zip(y,x)

for i, coord in enumerate(yx):
    arr[coord] = z[i]

print arr
>>> [[  0.  15.   0.]
     [ 14.  16.  18.]
     [ 17.   0.  13.]]

arr[coord[0], coord[1]] ist eine bessere Möglichkeit der Indizierung ein 2d-array.
Oder auch arr[coord] mit @Dave ' s Antwort

InformationsquelleAutor kezzos

2

Wenn Sie scipy installiert, können Sie die Vorteile von Ihr sparse matrix-Modul. Erhalten Sie die Werte aus der Textdatei mit genfromtxt, und stecken Sie diesen 'Spalten' direkt in ein sparse matrix-Schöpfer.
```
In [545]: txt=b"""x y z
0 1 14
0 2 17
1 0 15
1 1 16
2 1 18
2 2 13
"""

In [546]: xyz=np.genfromtxt(txt.splitlines(),names=True,dtype=int)

In [547]: sparse.coo_matrix((xyz['z'],(xyz['y'],xyz['x']))).A     
Out[547]: 
array([[ 0, 15,  0],
       [14, 16, 18],
       [17,  0, 13]])
```
Aber Joe ' s z_array=np.zeros((3,3),int); z_array[xyz['y'],xyz['x']]=xyz['z'] wesentlich schneller.

InformationsquelleAutor hpaulj

Nette Antworten von anderen. Dachte, das könnte ein nützliches snippet für jemand anderen, vielleicht brauchen diese.

def make_grid(x, y, z):
    '''
    Takes x, y, z values as lists and returns a 2D numpy array
    '''
    dx = abs(np.sort(list(set(x)))[1] - np.sort(list(set(x)))[0])
    dy = abs(np.sort(list(set(y)))[1] - np.sort(list(set(y)))[0])
    i = ((x - min(x)) / dx).astype(int) # Longitudes
    j = ((y - max(y)) / dy).astype(int) # Latitudes
    grid = np.nan * np.empty((len(set(j)),len(set(i))))
    grid[-j, i] = z # if using latitude and longitude (for WGS/West)
    return grid

InformationsquelleAutor Solomon Vimal

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.

Umgang mit non-uniform x & y-Eingang