Postgres nicht verwenden Sie einen index mit "ORDER BY"

Ich habe eine sehr große Tabelle.
Ich habe einen index auf den Spalten col1.
Wie erhalte ich die bestellten Daten von col1.
Aus der Abfrage-plan kann ich sagen, dass es nicht den index verwenden.
Wenn ich "LIMIT", es beginnt mit der Verwendung des index
Für große Wert für "LIMIT", es Stoppt die Verwendung des index.

Keine Ahnung?

P. S. ich möchte die Daten gruppierte Werte von spalte1 (nicht unbedingt sortiert ist), irgendwelche Vorschläge außer "ORDER BY".

DANK !!

Wo ist das Ergebnis von EXPLAIN ANALYZE? Ohne Sie, niemand hat eine Ahnung, warum die Dinge nicht so funktionieren wie Sie denken würde.

InformationsquelleAutor Mohamed Amir | 2010-11-19

6

Wenn Ihr wieder alle Zeilen aus der Tabelle ein index-scan wird langsamer sein als ein table-scan.
Warum denken Sie, müssen Sie die index-Nutzung?

Könnten Sie versuchen, zu verwenden

set enable_seqscan = false

zur Deaktivierung der sequenziellen scan, aber ich bin mir sicher, die wird langsamer sein als mit dem sequenziellen scan.

BESTELLUNG DURCH die nur Methode zum Sortieren Ihrer Daten. Jede andere Sortierung, die Sie vielleicht sehen, ist reiner Zufall

Bearbeiten

Um die Sache aufzuklären: ich nicht empfehlen turn-seq scan aus. Ich habe gerade gebucht dies als eine Möglichkeit zu zeigen, dass die seq-scan ist in der Tat schneller als die index-scan. Einmal ausgeschaltet, wird der Ausführungsplan mit index-scan wird wahrscheinlich langsamer sein als der seq-scan zeigt die OP, dass es keine Notwendigkeit für einen index-scan.
- Nehmen wir an, das ist ein Schlüssel->Wert-Tabelle. Ich möchte wieder alle Zeilen, aber Einträge mit dem gleichen Schlüssel nacheinander in das Ergebnis gesetzt, aber die Sortierung ist nicht wirklich wichtig.
- Dann fügen Sie eine "ORDER BY the_key_column" - Klausel. Es ist die nur zuverlässige Möglichkeit, Ihre Daten Sortieren
- Sehr schlechte Idee, enable_seqscan aus, löst es nicht das eigentliche problem.
- Ich habe ausdrücklich geschrieben, dass es langsamer sein wird. Ich wollte nur zeigen das OP eine Methode, um zu überprüfen, dass das Scannen der Tabelle ist tatsächlich schneller, dass der seq-scan.
- Mit index hat theoretisch den Vorteil von streaming-Daten sofort und ohne Speicher-overhead, anstatt zu warten, bis die Sortierung berechnet und gespeichert, bevor Sie gesendet an den client.
InformationsquelleAutor a_horse_with_no_name
4

Zusätzlich zu der Antwort von a_horse_with_no_name:

Verwendung eines index tatsächlich zwei unterschiedliche Vorgänge: Erstens die von Ihnen gewünschten Wert gesucht wird im index. Im index ist die Adresse, mit der die komplette Aufzeichnung, die wird dann aufgelöst. Beide Operationen sind sehr schnell für bestimmte Abfragen.

Wenn Sie planen, alle oder die meisten Platten ja eh, der Vorteil verschwindet. Wenn Sie möchten alle Datensätze aus und gehen Sie durch den index, dauert es länger, weil für jeden Datensatz gibt es zwei sucht. Es ist einfacher zu laufen, nur über die ganze Tabelle ohne index, da dies eine zu suchen, die pro Spalte (ja, ich weiß, eigentlich ist es weniger, als dass die da ganze Blöcke gelesen werden, usw... ich will einfach nur, um es einfach zu halten).
- Aber über den index speichert die Sortierung Zeit, nehme ich an.
- Nein, und das diese ganze Erklärung ist, warum nicht.
- Lesen Sie auch die "Indizes und ORDER BY" - Abschnitt des Handbuchs finden Sie eine ähnliche Erklärung.
- Ich habe keine Ahnung, wie Postgres Arten von Daten im Speicher, aber für die sequenzielle Lesen alle/die meisten Daten aus der Tabelle würde ich mir vorstellen ein treesort on-the-fly, wie die Daten gelesen werden, viel schneller als die zusätzliche Dereferenzierungsebene und cache Missbrauch erlebt, wenn einen index mit der gewünschten Bestellung.
InformationsquelleAutor musiKk

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.