nearest neighbor - k-d-Baum - wikipedia Beweis

Auf dem wikipedia-Eintrag für k-d-Bäume, wird ein Algorithmus vorgestellt, für eine nächste-Nachbar-Suche auf einem k-d-Baum. Was ich nicht verstehe, ist die Erklärung von Schritt 3.2. Wie Sie wissen, gibt es nicht einen Punkt näher, gerade weil der Unterschied zwischen den splitting-Koordinate der Suche nach Punkt und der aktuelle Knoten ist größer als die Differenz zwischen dem splitting-Koordinate der Suche nach Punkt und die aktuelle besten?

Nächste-Nachbar-Suche-Animation
NN-Suche mit einem KD-Baum 2D -

Nächsten Nachbar (NN) - Algorithmus
Ziele um den Punkt zu finden in dem Baum
die am nächsten zu einer gegebenen Eingabe
Punkt. Diese Suche kann getan werden
effizient mit dem Baum
Eigenschaften, die zu beseitigen Sie schnell große
Teile des suchraums.
Die Suche nach einem nächsten Nachbarn in einem
kd-Baum wie folgt vorgegangen:

Beginnend mit dem Wurzelknoten, der Algorithmus bewegt sich nach unten den Baum
rekursiv, in der gleichen Weise, dass es
wenn der Suchpunkt wurden
eingefügt (d.h. es geht rechts oder Links
je nachdem, ob der Punkt
größer oder kleiner als der aktuelle Knoten
in der split dimension).

Sobald der Algorithmus erreicht einen Blatt-Knoten, der es speichert, dass der Knoten Punkt als
die "aktuellen " besten"

Der Algorithmus läuft die Rekursion des Baumes, die Durchführung der
folgenden Schritte auf jedem Knoten:
1. Wenn der aktuelle Knoten ist näher als die aktuellen besten sind, dann ist es
wird die aktuelle am besten.
2. Der Algorithmus überprüft, ob es sein könnte, keine Punkte auf
die andere Seite der splitting-plane
näher an der Suche Punkt
als die zurzeit beste. Konzept,
dies wird durch die sich kreuzenden
splitting-hyperplane mit einem
hypersphäre um die Suche Punkt
das hat einen radius gleich dem aktuellen
nächste Entfernung. Da die
hyperplanes sind alle axis-aligned diese
implementiert ist als ein einfacher Vergleich
um zu sehen, ob der Unterschied zwischen
die splitting-Koordinate der Suche
Punkt und aktuelle Knoten weniger als
die Distanz (Globale Koordinaten)
von der Suche an der aktuellen
best.
1. Wenn die hypersphäre überquert das Flugzeug, es könnte sein
näher die Punkte auf der anderen Seite der
Flugzeug, so muss der Algorithmus nach unten verschieben
der andere Zweig des Baumes, aus dem
aktuellen Knoten suchen, näher
Punkte, die gleiche rekursive
Prozess, da die gesamte Suche.
2. Wenn die hypersphäre nicht den Schnittpunkt mit der splitting plane,
dann der Algorithmus weiter zu Fuß
oben auf dem Baum, und der gesamte Zweig auf
die andere Seite von diesem Knoten ist
beseitigt.

Wenn der Algorithmus beendet ist dieser Prozess für den root-Knoten, dann die
Suche abgeschlossen ist.

In der Regel verwendet der Algorithmus mit quadrierten
Entfernungen für den Vergleich zu vermeiden
computing Quadratwurzeln. Darüber hinaus
es kann speichern Sie die Berechnung durch das gedrückt halten der
squared aktuelle beste Entfernung in einer
Variablen für den Vergleich.

InformationsquelleAutor oob | 2009-10-26

kdtree nearest-neighbor

13

Schauen Sie genau auf dem 6. Bild des animation auf dieser Seite.

Als der Algorithmus geht zurück bis die Rekursion ist es möglich, dass es eine engere Stelle auf der anderen Seite des hyperplane, dass es auf. Wir haben überprüft, die eine Hälfte, aber es könnte eine noch engere Punkt auf der anderen Hälfte.

Gut, es stellt sich heraus, dass wir manchmal eine Vereinfachung. Wenn es unmöglich, damit es zu einem Punkt auf der anderen Hälfte näher, als unseren derzeit besten (am nächsten) Punkt, dann können wir überspringen, dass hyperplane Hälfte völlig. Diese Vereinfachung ist in der Abbildung auf der 6. frame.

Herauszufinden, ob diese Vereinfachung möglich ist, erfolgt durch Vergleich der Entfernung von der hyperplane zu unserer Suchmaschine Lage. Da die hyperplane ist ausgerichtet auf die Achsen, die kürzeste Linie, von der Sie zu jedem anderen Punkt wird eine Linie entlang einer dimension, so können wir vergleichen nur die Koordinate der dimension, der hyperplane-splits.

Wenn es weiter von der Suche zeigen Sie auf der hyperplane als von der Suche zeigen Sie auf Ihrer aktuellen nächsten Punkt, dann gibt es keinen Grund zu der Suche nach Vergangenheit, dass die Spaltung koordinieren.

Selbst wenn meine Erklärung nicht hilft, wird die Grafik. Viel Glück auf Ihr Projekt!
- Das ist das fehlende Glied, die gemacht werden, verstehen den Algorithmus. Wie es scheint, keine der anderen Erklärungen Zeit nehmen, um zu erklären, die Vereinfachung Schritt (oder Sie erwähnen es als eine nebenbei-Sache).
InformationsquelleAutor Andrew

Ja, die Beschreibung von NN (Nearest Neighbour) Suche in einem KD-Tree auf Wikipedia ist ein wenig schwer zu Folgen. Es hilft nicht, dass eine viel der top-Google-Suchergebnisse auf NN KD-Baum sucht, sind schlicht und einfach falsch!

Hier einige C++ - code zu zeigen, wie Sie es richtig:

template <class T, std::size_t N>
void KDTree<T,N>::nearest (
    const const KDNode<T,N> &node,
    const std::array<T, N> &point, //looking for closest node to this point
    const KDPoint<T,N> &closest,   //closest node (so far)
    double &minDist,
    const uint depth) const
{
    if (node->isLeaf()) {
        const double dist = distance(point, node->leaf->point);
        if (dist < minDist) {
            minDist = dist;
            closest = node->leaf;
        }
    } else {
        const T dim = depth % N;
        if (point[dim] < node->splitVal) {
            //search left first
            nearest(node->left, point, closest, minDist, depth + 1);
            if (point[dim] + minDist >= node->splitVal)
                nearest(node->right, point, closest, minDist, depth + 1);
        } else {
            //search right first
            nearest(node->right, point, closest, minDist, depth + 1);
            if (point[dim] - minDist <= node->splitVal)
                nearest(node->left, point, closest, minDist, depth + 1);
        }
    }
}

API für die NN-Suche auf einen KD-Baum:

//Nearest neighbour
template <class T, std::size_t N>
const KDPoint<T,N> KDTree<T,N>::nearest (const std::array<T, N> &point) const {
    const KDPoint<T,N> closest;
    double minDist = std::numeric_limits<double>::max();
    nearest(root, point, closest, minDist);
    return closest;
}

Standard-Distanz-Funktion:

template <class T, std::size_t N>
double distance (const std::array<T, N> &p1, const std::array<T, N> &p2) {
    double d = 0.0;
    for (uint i = 0; i < N; ++i) {
        d += pow(p1[i] - p2[i], 2.0);
    }
    return sqrt(d);
}

Edit: einige Leute Fragen nach Hilfe bei der Daten-Strukturen (nicht nur der NN-Algorithmus), so hier ist, was ich verwendet habe. Je nach Zweck haben, möchten Sie vielleicht ändern Sie die data-Strukturen leicht. (Anmerkung: aber Sie fast sicher nicht möchten, ändern Sie die NN-Algorithmus.)

KDPoint Klasse:

template <class T, std::size_t N>
class KDPoint {
    public:
        KDPoint<T,N> (std::array<T,N> &&t) : point(std::move(t)) { };
        virtual ~KDPoint<T,N> () = default;
        std::array<T, N> point;
};

KDNode Klasse:

template <class T, std::size_t N>
class KDNode
{
    public:
        KDNode () = delete;
        KDNode (const KDNode &) = delete;
        KDNode & operator = (const KDNode &) = delete;
        ~KDNode () = default;

        //branch node
        KDNode (const T                       split,
                std::unique_ptr<const KDNode> &lhs,
                std::unique_ptr<const KDNode> &rhs) : splitVal(split), left(std::move(lhs)), right(std::move(rhs)) { };
        //leaf node
        KDNode (std::shared_ptr<const KDPoint<T,N>> p) : splitVal(0), leaf(p) { };

        bool isLeaf (void) const { return static_cast<bool>(leaf); }

        //data members
        const T                                   splitVal;
        const std::unique_ptr<const KDNode<T,N>>  left, right;
        const std::shared_ptr<const KDPoint<T,N>> leaf;
};

KDTree Klasse: (Hinweis: Sie benötigen zum hinzufügen einer member-Funktion zu bauen/füllen Sie Ihren Baum.)

template <class T, std::size_t N>
class KDTree {
    public:
        KDTree () = delete;
        KDTree (const KDTree &) = delete;
        KDTree (KDTree &&t) : root(std::move(const_cast<std::unique_ptr<const KDNode<T,N>>&>(t.root))) { };
        KDTree & operator = (const KDTree &) = delete;
        ~KDTree () = default;

        const KDPoint<T,N> nearest (const std::array<T, N> &point) const;

        //Nearest neighbour search - runs in O(log n)
        void nearest (const std::unique_ptr<const KDNode<T,N>> &node,
                      const std::array<T, N> &point,
                      std::shared_ptr<const KDPoint<T,N>> &closest,
                      double &minDist,
                      const uint depth = 0) const;

        //data members
        const std::unique_ptr<const KDNode<T,N>> root;
};

Mein C++ ist kindof schwer, aber ich glaube, du bist fehlen einige wichtige code hier. Es gibt keine definition von KDNode oder KDPoint.
distance(point, node->leaf->point); Ich denke, dass dies auch füllen des Arrays Punkt mit allen Punkten in diesem Teilbereich? Könnten Sie bitte etwas näher erläutern?
die Frage war über die NN Algorithmus, aber ich habe Hinzugefügt-info über die Datenstrukturen zu machen, eine allzu umfassende Antwort. 🙂
Abstand() ist einfach die Trennung zwischen 2 Punkten. Bearbeitete ich die Antwort auf meine default-Implementierung. Hoffentlich wird diese einfache, aber entscheidende Konzept ist die Sache jetzt klarer?
Danke, finde ich den extra-code hilfreich, nicht sehr vertraut mit Baum-Strukturen.

InformationsquelleAutor Scott Smedley

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.