SQL server 2008-XML-Datentyp, der von performance-Problemen

Hallo ich habe ein Bedürfnis zu lagern Hunderte, wenn nicht Tausende von Elementen in der Datenbank als XML. Ich werde nicht index etwas in das XML-Feld. Ich werde einfach wählen Sie bestimmte Elemente innerhalb der xml-Datei. Ich würde gerne wissen, ob es irgendwelche performance-Strafe für einfach auswählen der Felder in der XML. Hier ist Beispiel-XML wird in der Datenbank gespeichert werden.

<fields>
    <field name="FirstName" type="text" value="Gary" sort="2" />
    <field name="LastName" type="text" value="Smith" sort="3" />
    <field name="City" type="text" value="Los Angeles" sort="4" />
    <field name="Age" type="number" value="12" sort="6" />
    <field name="Address" type="text" sort="2">
        <streetnumber value="1234" />
        <streetname value="sail" />
    </field>
</fields>

Werde ich wahrscheinlich mehr als 3000 field-tags in einem Datensatz. Ich möchte einfach bekommen Sie 10 Felder in einer einzigen Abfrage. Ich habe einen primary key auf die Tabelle und Auswahl von Datensätzen basierend auf den primär-Schlüssel, aber immer werden die Felder aus der XML-Spalte. Ich fürchte, die mehrere field-Elemente, die ich in der XML wird der Kompromiss Leistung. Wird es eine performance-Strafe für einfach durch Auswahl von 10 oder mehr Felder aus der XML-Spalte? Auch ich werde nicht mit der xml-Spalte in einer where-Klausel verwende ich für die wichtigsten in der where-Klausel dann wähle ich die Felder aus der XML-Spalte. Gibt es Leistungseinbußen?

searchsqlserver.techtarget.com/tip/...

InformationsquelleAutor Luke101 | 2013-11-29

3

Basierend auf meiner Erfahrung auf XML in SQL Server-Xml-Datentyp, und auf Indizes für Spalten des Typs XML-Daten (der ganze Abschnitt verdient gründliches Lesen)

Wird es eine performance-Strafe für einfach durch Auswahl von 10 oder mehr
Felder aus der XML-Spalte ?

Ja, weil Ihr XML-Dokument als blob gespeichert werden. Ohne einen primären XML-index, dieses blob muss aufgelöst werden für die Verarbeitung der Abfrage (Filterung und Projektion)
Als XML-Indizes können gesehen werden als relationale Darstellung des Dokuments (pre-Explosion der blob)

Ohne index, diese binäre große Objekte werden geschreddert zur Laufzeit, um eine Abfrage auszuwerten. Diese Aufteilung kann sehr zeitaufwändig sein

Als zu Ihrer zweiten Frage,

Auch, ich werde nicht mit der xml-Spalte in einer where-Klausel verwende ich für die wichtigsten in der where-Klausel dann werde ich wählen Sie Felder aus der XML
Spalte. Wird es eine performance-penalty?

Wenn Sie gehen, um Projekt unter 3000 Feld tags, die Sie könnte profitieren von einer sekundären XML-index, aber ich bin mir nicht sicher welchen. EIGENSCHAFT sekundären index scheint fit für die Projektion, aber es scheint zu gelten value Anrufe (die französische Dokumentation scheint zu implizieren mehr als nur value Anrufe, aber das kann einige übersetzungsfehler)

Ich für meinen Teil beendet-up-Einstellung der drei Arten von sekundären Indizes auf meiner XML-Spalte (1 Millionen Dokumente aus über 30 verschiedenen schemas, 50-100 Elemente jeder), Aber meine app benötigt eine Menge mehr Filter-als Projektion.
- Diese Antwort scheint am besten (bisher), für mich, für die direkte Beantwortung der Fragen.
- Danke, ich habe bestätigt, dass dies wahr ist. Ich erstellt ein xml-Dokument mit 100K Elemente dann gespeichert in einer XML-Spalte auf dem server. Dann versuchte ich zu accesss die 90.000 th-element. auf meinem Rechner dauerte es 14 Sekunden, um Zugriff auf das element. Ich habe dieses gleiche Szenario in mongoDB und zugänglich die 90.000 th-token im Dokument-Datenbank. Das war instant. MongoDB ist der richtige Weg angesichts Ihrer nahezu sofortigen Zugriff auf alle token im BSON. Danke für deine Antwort.Auch, alle diese tests nicht auch Indizes.
- Sorry, dieser Beitrag ist alt,aber das Beispiel ist relevant für mein problem.Angenommen, die Tabelle User und der Tabelle "Adressen" haben eine viele-Beziehung.Lassen Sie uns sagen, in Planen, die ich erstellen Adressen-Tabelle mit separater Spalte für jeden und es gibt keine xml-Spalte.So bin ich unter Millionen der Aufzeichnung.Jetzt Im plan B ich glaube nicht, erstellen Sie separate Tabelle.Fügen Sie eine zusätzliche Spalte in Table1 "Adresse (xml Typ)" und speichern Sie den Wert in ähnlicher Weise.Auf diese Weise habe ich 4 mal weniger aufnehmen als Plan A., So der Plan, wird die Leistung besser ?
InformationsquelleAutor jbl
1

[BEGIN BEARBEITEN]

jbl direkte Antworten auf Ihre Fragen und Terror.Blade Antwort re " XML ist besser als NVARCHAR(MAX), beide machen Sinn (ich von Ihnen positiv bewertet werden Sie :).

Meine Erfahrung war, ohne die Speicherung eines XML-Schemas in SQL Server (Schrecken.Blade-tip), und ohne Indizierung (jbl Gaben die meisten, re' das)... aber ich lasse meine Antwort, weil ich denke, dass meine links wären sehr hilfreich... und es ist immer noch ein Beispiel für worst-case 😉

[ENDE EDIT]

Aus Erfahrung kann ich Ihnen sagen, dass die laden eines XML-Daten-Typ ist schnell, aber, wie es zu verwenden-ich fand, dass langsam sein, aber das persönliche Beispiel in den Sinn kommen beteiligt aktualisieren und verwenden von xQuery, und diese wurden möglicherweise Faktoren in meinem Verlangsamung.
In diesem Beispiel dauerte es 1hr55mins verarbeiten nur 127,861 Zeilen.
(Schrecken.Klinge ist Spitze, der die Speicherung eines XML-Schemas in SQL Server, und die jbl 's link & share-re' XML-Indizierung beide klingen ziemlich glatt 😉 und vielleicht Adresse, die Verlangsamung.)

VERWANDTE:
Hier sind einige Tipps, re' Optimierung von XML in SQL... obwohl einige von Ihnen gelten nur, wenn Sie die Kontrolle über das format der XML:

http://msdn.microsoft.com/en-us/library/ms345118.aspx

Wenn Sie xQuery, schauen Sie sich diese docs:

http://download.microsoft.com/download/0/F/B/0FBFAA46-2BFD-478F-8E56-7BF3C672DF9D/XQuery%20Language%20Reference.pdf

((Und wenn Sie SQLXMLBulkLoad an alle, die erwägen, mit "overflow-Bereich"s, um zu erfassen, was nicht im schema definiert. Es gibt einige nützliche Tipps in diesem peripher mit TechNote:

http://social.technet.microsoft.com/Forums/sqlserver/en-US/393cf604-bf6e-488b-a1ea-2e984aa14500/how-do-i-redirect-xml-comments-that-sqlxmlbulkload-is-storing-in-the-overflowfield?forum=sqlxml ))

HTH.

InformationsquelleAutor Doug_Ivison
0

Ich feststellen, dass dies nicht die direkte Antwort auf die OP-Frage (obwohl, es ist im Zusammenhang mit der es), aber ich glaube, das könnte wirklich helfen, viele Menschen, die umgeleitet wurden hier suchen einige Idee, wie Sie sich mit der schlechten Leistung bei der XML-Datentyp in SQL Server. Nach vielen Jahren kämpfen mit diesem Problem, habe ich endlich eine Lösung gefunden, dass aus irgendeinem Grund, ist nicht so leicht zu bekommen:

SXI - Selektive XML-Indizes (ab SQL 2008)

MS-Docs-link:
https://docs.microsoft.com/en-us/sql/relational-databases/xml/selective-xml-indexes-sxi?view=sql-server-2017

Auf meinen lokalen tests mit Tabellen mit 3MM+ Datensätze, es funktionierte erstaunlich gut!

InformationsquelleAutor Vinicius

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.