Brauche ich einen primary key für meine Tabelle, die einen EINDEUTIGEN (zusammengesetzten 4-Säulen), von denen eine NULL ist?

Habe ich die folgende Tabelle (PostgreSQL-8.3) speichert, Preise für einige Produkte. Die Preise sind synchronisiert mit einer anderen Datenbank, im wesentlichen die meisten Felder (bis auf eines) sind nicht aktualisiert, von unserem Kunden, sondern gelöscht und aktualisiert alle once-in-a-Weile, um zu synchronisieren mit einem anderen Lager-Datenbank:

CREATE TABLE product_pricebands (
    template_sku varchar(20) NOT NULL,
    colourid integer REFERENCES colour (colourid) ON DELETE CASCADE,        
    currencyid integer NOT NULL REFERENCES currency (currencyid) ON DELETE CASCADE,
    siteid integer NOT NULL REFERENCES site (siteid) ON DELETE CASCADE,

    master_price numeric(10,2),

    my_custom_field boolean, 

    UNIQUE (template_sku, siteid, currencyid, colourid)
);

An der synchronisation, die ich im Grunde LÖSCHEN Sie die meisten der obigen Daten, außer für Daten, WO my_custom_field WAHR ist (wenn es WAHR ist, bedeutet es, dass der client aktualisiert das Feld über Ihre CMS-und deshalb soll dieser Datensatz nicht gelöscht werden). Ich FÜGEN Sie dann die 100te bis 1000de von Zeilen in der Tabelle und AKTUALISIEREN Sie, wo der Vorgang schlägt fehl (D. H. wenn die Kombination von (template_sku, siteid, currencyid, colourid) bereits vorhanden ist).

Meine Frage ist - was die beste Praxis sollte hier angewandt werden, um einen Primärschlüssel zu erstellen? Ein Primärschlüssel ist Sie sogar notwendig? Ich wollte die Primärschlüssel = (template_sku, siteid, currencyid, colourid) - aber die colourid Feld kann NULL sein, und es auch in einem zusammengesetzten Primärschlüssel nicht möglich.

Von was ich gelesen habe auf anderen Foren, ich glaube, ich habe das oben richtig, und brauchen nur zu klären:

1) Sollte ich ein "serial" primary key falls ich jemals einen brauchen? Im moment weiß ich nicht, und glaube nicht, dass ich jemals wird, denn die wichtigen Daten in der Tabelle ist der Preis und mein benutzerdefiniertes Feld, nur gekennzeichnet durch das (template_sku, siteid, currencyid, colourid) Kombination.

2) Da (template_sku, siteid, currencyid, colourid) ist die Kombination, die ich verwenden, um eine Abfrage eines Produkts, Preis, sollte ich hinzufügen, eine weitere Indizierung zu meinem Spalten, wie das "template_sku" das ist ein varchar? Oder ist die UNIQUE-Einschränkung wird ein guter index schon für mein Auswählt?

colourid null-Werte zulässt. Das macht es zu einem fiesen Mitglied für einen Primärschlüssel.
OK, hier ist die einfache Antwort. Wenn Sie eine Tabelle mit Spalten a,b,c,d und d, die null-Werte zulässt, können Sie live mit Zeilen, die die gleiche a -, b-und c-Felder? Wenn ja, dann was du hast ist in Ordnung. Wenn Sie brauchen, um Sie auseinander zu halten, dann müssen Sie einen eindeutigen index für a,b,c oder einen partiellen index auf a,b,c, wobei d null ist.

InformationsquelleAutor rishijd | 2012-05-09

11

Sollte ich eine "serielle" primary key falls ich jemals einen brauchen?

Können Sie ganz einfach eine serial-Spalte später, wenn Sie einen brauchen:
```
ALTER TABLE product_pricebands ADD COLUMN id serial;
```
Wird die Spalte gefüllt werden mit einzigartigen Werte automatisch. Auch können Sie stellen Sie den primär-Schlüssel in der gleichen Anweisung (wenn kein Primärschlüssel definiert ist, aber dennoch):
```
ALTER TABLE product_pricebands ADD COLUMN id serial PRIMARY KEY;
```
Wenn Sie auf die Tabelle aus anderen Tabellen, die ich würde Ihnen raten, einen solchen Surrogat Primärschlüssel, denn es ist ziemlich schwerfällig, um link durch vier Spalten. Es ist auch langsamer in SELECTs mit JOINs.

Entweder Weg, Sie sollte einen Primärschlüssel definieren. Der EINDEUTIGE index, darunter eine null-Spalte ist nicht ein vollständiger Ersatz. Es kann Duplikate für Kombinationen, darunter ein NULL-Wert, da die zwei NULL-Werte sind nie als die gleichen. Dies kann zu Schwierigkeiten führen.

Als

den colourid Feld kann NULL sein,

möglicherweise möchten Sie erstellen zwei eindeutige Indizes. Die Kombination (template_sku, siteid, currencyid, colourid) keine PRIMARY KEY wegen der null-Werte zulässt colourid, aber Sie können erstellen ein UNIQUE Einschränkung, wie Sie bereits haben (die Umsetzung eines index automatisch):
```
ALTER TABLE product_pricebands ADD CONSTRAINT product_pricebands_uni_idx
UNIQUE (template_sku, siteid, currencyid, colourid)
```
Dieser index deckt perfekt den Fragen, die Sie erwähnen, in 2).

Erstellen Sie eine teilweise eindeutigen index zusätzlich, wenn Sie wollen vermeiden, "Duplikate" mit (colourid IS NULL):
```
CREATE UNIQUE INDEX product_pricebands_uni_null_idx
ON product_pricebands (template_sku, siteid, currencyid)
WHERE colourid IS NULL;
```
Decken alle Basen. Ich schrieb mehr über diese Technik in einem Verwandte Antwort auf dba.SE.

Die einfache alternative zu den oben genannten ist, um colourid NICHT NULL, und erstellen Sie eine primäre Taste anstelle der oben product_pricebands_uni_idx.

Ist auch, wie Sie

grundsätzlich LÖSCHEN die meisten Daten

für Ihre refill-Betrieb, wird es schneller sein, um die drop-Indizes, die sind nicht benötigt während der refill-Vorgang, und erstellen Sie diese anschließend. Es ist schneller, um eine Größenordnung zu bauen, die einen index von Grund auf als für alle Zeilen inkrementell.

Woher wissen Sie, welche Indexe benutzt (gebraucht)?
- Testen Sie Ihre Abfragen mit EXPLAIN ANALYZE.
- Oder verwenden Sie den integrierte Statistiken. pgAdmin zeigt die Statistik in einer separaten Registerkarte für das ausgewählte Objekt.
Kann es auch schneller sein, wählen Sie die wenigen Zeilen mit my_custom_field = TRUE in eine temporäre Tabelle, TRUNCATE der Basis-Tabelle und LEGEN Sie die re-überlebenden. Hängt davon ab, ob Fremdschlüssel definiert. Würde dann so Aussehen:
```
CREATE TEMP TABLE pr_tmp AS
SELECT * FROM product_pricebands WHERE my_custom_field;

TRUNCATE product_pricebands;
INSERT INTO product_pricebands SELECT * FROM pr_tmp;
```
Dies vermeidet eine Menge Staubsaugen.
- Hallo, vielen Dank so viel für diese, extrem nützlich aus vielen Blickwinkeln! Hier sind meine Kommentare von dem, was ich bisher versucht habe: - ich habe eine serial-Spalte, nur um es einfach zu Bearbeiten/löschen. - Durch surrogate primary key, meintest du den serial-key? Ich brauche, um diesen Preis Tabelle und anderen produktbezogenen Tabellen auf der Produkt-Liste und detail-Seite auf der website, und so würde ich brauchen, um die Abfrage durch (template_sku, siteid, currencyid, colourid).
- - Colourid kann null sein, wirklich nur für zwei Produkte von 100s. Diese beiden Produkte sind nicht im Zusammenhang mit Farbe im system. Trotzdem, ich denke, ich muss dieses Feld null sein, da es keinen Punkt gibt, hinzufügen eine spezielle Tabelle nur für diese beiden Produkte. Auch Hinzugefügt habe ich einen partiellen index, wie Sie sagte, "CREATE UNIQUE INDEX product_pricebands_uni_null_idx". Meine Frage ist jetzt, was Sie gesagt haben über die "Löschung von Daten". Ich habe versucht, ein EXPLAIN ANALYZE auf eine INSERT - es nicht zu nennen, die eindeutige Indizes, aber nur die FKs: z.B. Auslöser für die Einschränkung product_pricebands_colourid_fkey: Zeit=0.238 Anrufe=1
- Auslöser für die Einschränkung product_pricebands_currencyid_fkey: Auslöser für die Einschränkung product_pricebands_siteid_fkey: -- Daher, sollte ich voran gehen und die Indizes löschen, bevor Sie die LÖSCHEN und erneut einfügen, werden die INDIZES nach? Kann ich re-legen Sie die Indizes, bevor oder nachdem ich INSERT/UPDATE alle Daten? Ich bin verwirrt, ob die Indizes tatsächlich re-index selbst oder wenn ich tatsächlich zu löschen und fügen Sie Sie zurück an den Anfang und das Ende (jeweils) jeder synchronisation bulk insert/update?
- Ja, die serial-Spalte ist eine surrogate primary key. Indizes sind immer automatisch auf dem neuesten Stand. Drop & Neuerstellung erhöht die performance, falls fügen Sie die meisten oder alle der Daten in einer bulk-operation. Sie können das gleiche tun mit foreign key-Einschränkungen, es sei denn, Sie müssen die Integrität der Daten verifiziert werden während EINFÜGEN. Neu erstellen von Indizes und fk-constraints nachdem bulk-INSERT ist abgeschlossen.
- Will nur sagen, danke so sehr für all Eure Hilfe 🙂 zur info ich bin halten die Indizes in Takt, aber deine Antworten sind wirklich aufschlussreich.
InformationsquelleAutor Erwin Brandstetter

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.