Effizienter Weg, um wählen Sie alle Werte von einer Spalte nicht in einer anderen Spalte

Brauche ich, um alle Werte aus colA sind nicht in colB aus mytable. Ich bin mit:

SELECT DISTINCT(colA) FROM mytable WHERE colA NOT IN (SELECT colB FROM mytable)

Es funktioniert jedoch die Abfrage der Einnahme zu lange, um abzuschließen.

Ist es ein effizienter Weg, dies zu tun?

NOT IN verlangsamt, wie die Größe wächst, und es gibt oft ein limit, wie viele Zeilen können in der NOT IN - Klausel. Außerhalb der kleinen Ergebnis-sets die ich gefunden habe, ist es besser, andere Mittel, um den Unterschied zwischen zwei Ergebnismengen.
Beim sprechen über Leistung, müssen Sie den Namen Ihres RDBMS oder bekommen suboptimale Antworten.

InformationsquelleAutor Flash | 2012-01-05

16

In standard-SQL gibt es keine Klammern in DISTINCT colA. DISTINCT ist nicht eine Funktion.
```
SELECT DISTINCT colA
FROM   mytable
WHERE  colA NOT IN (SELECT DISTINCT colB FROM mytable);
```
Hinzugefügt DISTINCT zu der sub-select als gut. Wenn Sie viele Duplikate, könnte es beschleunigt die Abfrage.

CTE könnte schneller sein, je nach DBMS. Ich darüber hinaus zeigen LEFT JOIN als alternative ausschließen, die Werte in valB, und eine alternative Möglichkeit, um bestimmte Werte mit GROUP BY:
```
WITH x AS (SELECT colB FROM mytable GROUP BY colB)
SELECT m.colA
FROM   mytable m
LEFT   JOIN x ON x.colB = m.colA
WHERE  x.colB IS NULL
GROUP  BY m.colA;
```
Oder, noch weiter vereinfacht und mit einer einfachen Unterabfrage (vermutlich die Schnellste):
```
SELECT DISTINCT m.colA
FROM   mytable m
LEFT   JOIN mytable x ON x.colB = m.colA
WHERE  x.colB IS NULL;
```
Gibt es grundsätzlich 4 Techniken ausschließen von Zeilen mit Tasten vorhanden, die in einem anderen (oder derselben) Tabelle:
- Wählen Sie die Zeilen, die nicht in andere Tabelle
Der entscheidende Faktor für die Geschwindigkeit wird Indizes. Sie müssen Indizes auf colA und colB für diese Abfrage schnell sein.
- Danke, ich habe versucht: SELECT DISTINCT m1.colA FROM mytable m1 LEFT JOIN mytable m2 ON (m1.colA = m2.colB) WHERE m2.colA IS NULL ORDER BY m1.colA ASC und es ist mehrere Größenordnungen schneller und scheint zu funktionieren - ist dies äquivalent zu dem code, den ich gepostet in der Frage? Es ist so viel schneller, dass ich bin misstrauisch, ich könnte etwas verpasst haben.
- Sorry, du hast einen Schreibfehler in deiner Abfrage. Muss WHERE m2.colB IS NULL. Die (korrigierten) Abfrage könnte schneller sein, mit LEFT JOIN (SELECT DISTINCT colB FROM mytable) m2 ON m2.colB = m1.colA wenn es gibt viele doppelte Werte für colB.
- ist immer NULL wenn m2.colB ist NULL hier, aber m2.colA NULL sein kann, auch wenn m2.colB ist nicht. Also richtige (und schnellere!) form ist hier: WHERE m2.colB IS NULL. Wenn colA definiert ist, NICHT NULL ist, dann ist deine Abfrage richtig ist.
- Danke, die Abfragen geben mir die gleiche Anzahl von Ergebnissen, die ich nehme an, weil es keine NULL Werte. Wissen Sie, warum es ist so viel schneller?
- Unterschiedliche Abfragepläne anders aufführen. Kann ich nicht viel sagen, ohne zu wissen, das RDBMS, das Sie verwenden. Möchten Sie vielleicht zu Bearbeiten, dass die Informationen zu deiner Frage. Informationen über Indizes wäre instrumental, zu.
- Ok, vielen Dank. Ich habe die DISTINCT änderung, die Sie vorgeschlagen, und es vervollständigt nun in wenigen Sekunden.
InformationsquelleAutor Erwin Brandstetter
6

Können Sie exists:
```
select distinct
    colA
from
    mytable m1
where
    not exists (select 1 from mytable m2 where m2.colB = m1.colA)
```
exists hat einen semi-join zu schnell mit den Werten. not in rundet das ganze ResultSet und führt dann eine or auf Sie. exists ist in der Regel schneller für Werte in Tabellen.
- Können Sie vielleicht erklären, wie diese Abfrage funktioniert?
- Sicher!!! Es sagt, greifen Sie das distinct - colAs, wo es keine Zeile aus mytable dass colB ist gleich colA.
InformationsquelleAutor Eric
0

Können Sie die AUßER Betreiber, die effektiv diffs zwei SELECT Abfragen. EXCEPT DISTINCT zurück, so dass nur einzigartige Werte. Oracle MINUS - operator entspricht EXCEPT DISTINCT.

InformationsquelleAutor Paul

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.