Wählen Sie die Zeilen einer matrix, die eine Bedingung erfüllt

In R mit einer matrix:

     one two three four
 [1,]   1   6    11   16
 [2,]   2   7    12   17
 [3,]   3   8    11   18
 [4,]   4   9    11   19
 [5,]   5  10    15   20

Möchte ich extrahieren Sie die submatrix, deren Zeilen der Dritten Spalte = 11. Das heißt:

      one two three four
 [1,]   1   6    11   16
 [3,]   3   8    11   18
 [4,]   4   9    11   19

Ich möchte dies tun, ohne looping. Ich bin neu in R also ist das wohl sehr offensichtlich, aber die
Dokumentation ist oft etwas knapp.

Die grundlegende Idee, die in jeder Antwort ist, dass, wenn Sie einen logischen Vektor/matrix (Wahrheiten und FALSEs) von der gleichen Länge wie der index, den Sie wählen, wird nur die Fälle, die WAHR sind. Ausführen des codes zwischen [ ] Sie die Antworten und Sie werden sehen, dies noch deutlicher.

InformationsquelleAutor peter2108 | 2011-03-22

matrix r select submatrix

139

Dies ist leichter zu tun, wenn Sie konvertieren Sie Ihre matrix, um einen Daten-frame mit als.Daten.frame(). In diesem Fall werden die vorherigen Antworten (mit Untergruppen oder m$drei) arbeiten, sonst werden Sie nicht.

Zum ausführen des Vorgangs auf ein matrix, können Sie eine Spalte definieren, indem Sie Namen:
```
m[m[, "three"] == 11,]
```
Oder nach der Anzahl:
```
m[m[,3] == 11,]
```
Beachten Sie, dass wenn nur eine Zeile zutrifft, wird das Ergebnis ein integer-Vektor, keine matrix.
- wenn Sie benötigen, um die matrix, dann tun m[m[,3] == 11,,drop=FALSE]
- Was wird die Lösung sein, wenn ich will, um zu definieren, werden einige Werte für eine Reihe von Spalten. zum Beispiel df <- df[!which(df$ARID3A:df$YY1 == "U"),], hier möchte ich entfernen Sie diese Zeilen aus meinem df, wo eine Reihe von Spalten (ARID3A: YY1) enthält den Wert , U.
- Wie funktioniert das, wenn Sie nicht wollen, geben Sie den Spaltennamen an alle, aber arbeiten möchten, die über alle Spalten in der matrix?
- Hey @neilfws , wie kann man add && Anweisung dazu? Ich brauche, um zwei Spalten Werte gleichzeitig?
InformationsquelleAutor neilfws
26
```
m <- matrix(1:20, ncol = 4) 
colnames(m) <- letters[1:4]
```
Den folgenden Befehl wählen, wird die erste Zeile der matrix oben.
```
subset(m, m[,4] == 16)
```
Und dies wird markieren Sie die letzten drei.
```
subset(m, m[,4] > 17)
```
Wird das Ergebnis eine matrix, in beiden Fällen.
Wenn Sie möchten, verwenden Sie die Spalte-Namen zu wählen Sie Spalten dann würden Sie am besten ab, Umwandlung in einen dataframe mit
```
mf <- data.frame(m)
```
Dann können Sie mit
```
mf[ mf$a == 16, ]
```
Oder, Sie könnte verwenden Sie den subset-Befehl.

InformationsquelleAutor John
18

Werde ich wählen, eine einfache Methode, mit der dplyr-package.

Wenn das dataframe ist-Daten.
```
library(dplyr)
result <- filter(data, three == 11)
```
InformationsquelleAutor mavez DABAS
10

Teilmenge ist eine sehr langsame Funktion , und ich persönlich finde es nutzlos.

Ich nehme an, Sie haben Daten.Rahmen -, array -, matrix genannt Mat mit A, B, C als Spaltennamen; dann alles, was Sie tun müssen, ist:
- In dem Fall von einer Bedingung auf eine Spalte, sagen wir Spalte A
```
Mat[which(Mat[,'A'] == 10), ]
```
Werden, wenn mehrere Bedingungen auf anderen Spalte, die Sie erstellen können, wird eine dummy-variable. Nehmen wir an, die Bedingungen sind A = 10, B = 5, und C > 2, dann haben wir:
```
    aux = which(Mat[,'A'] == 10)
    aux = aux[which(Mat[aux,'B'] == 5)]
    aux = aux[which(Mat[aux,'C'] > 2)]
    Mat[aux, ]
```
Durch die Prüfung der speed-Vorteil mit system.time, die which Methode ist 10x schneller als die subset Methode.

InformationsquelleAutor Mohamad Elmasri
5

Wenn die matrix genannt wird m, nutzen Sie einfach :
```
R> m[m$three == 11, ]
```
- Für Daten-frames, aber nicht mit Matrizen.
- Was wird die Lösung sein, wenn ich will, um zu definieren, werden einige Werte für eine Reihe von Spalten. zum Beispiel df <- df[!which(df$ARID3A:df$YY1 == "U"),], hier möchte ich entfernen Sie diese Zeilen aus meinem df, wo eine Reihe von Spalten (ARID3A: YY1) enthält den Wert U
InformationsquelleAutor juba
0

Wenn das dataset mit dem Namen data, dann werden alle Zeilen treffen einen Zustand, in dem Wert der Spalte 'pm2.5' > 300 empfangen werden können, indem -

Daten[Daten['pm2.5'] >300,]

InformationsquelleAutor Anvita Shukla

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.