Was bedeutet die Größe und Reaktion genau darstellen in einem SURF Knackpunkt?

Ich bin mit OpenCV 2.3 Eckdaten für die Erkennung und matching. Aber ich bin ein bisschen verwirrt mit den size und response Parameter von der Detektions-Algorithmus. Was tun Sie konkret?

Basierend auf der OpenCV-Handbuch, ich kann ' T es herausfinden:

float size: Durchmesser des sinnvollen Knackpunkt Nachbarschaft

float response: die Antwort von denen die meisten stark Eckdaten haben
ausgewählt worden. Kann verwendet werden, für die weitere Sortier-oder subsampling

Ich dachte, der beste Punkt, um zu verfolgen, wäre die mit der höchsten Reaktion, aber es scheint, dass es nicht der Fall ist. Also, wie könnte ich teilstichprobe der wichtigsten Punkte zurückgegeben, die von der surf-Detektor stets nur das beste im Begriff der Rückverfolgbarkeit?

InformationsquelleAutor der Frage Tulkkas | 2012-04-26

60

Größe und Reaktion

SURFEN ist ein blob-Detektor, kurz gesagt, die Größe einer Funktion ist die Größe des blob. Um genauer zu sein, die zurückgegebene Größe von OpenCV ist die Hälfte der Länge der approximierte Hesse-operator. Die Größe ist auch bekannt als Maßstab, ist dies aufgrund der Art und Weise der blob-Detektoren arbeiten, d.h., die funktionell gleich zu den ersten verwischt das Bild mit dem Gauß-filter mit mehreren Skalen und dann downsampling der Bilder und schließlich die Erkennung von blobs mit einer festen Größe. Siehe das Bild unten zeigt die Größe der SURF-features. Die Größe der einzelnen Features ist der radius des Kreises gezeichnet. Die Linien, die aus dem Zentrum von features auf die Umfang zeigen die Winkel oder Ausrichtung. In diesem Bild, die Antwort, die Stärke der blob detection filter ist farblich codiert. Sie können sehen, die Mehrheit der Funktionen erkannt haben, eine schwache Antwort. (siehe das Bild in voller Größe hier)

Dieses Histogramm zeigt die Verteilung der response-Stärke der Funktionen im Bild oben:

Welche Funktionen auf die Spur?

Die robusteste feature tracker verfolgt alle Funktionen erkannt. Je mehr Funktionen die mehr Robustheit. Aber es ist unpraktisch, zu verfolgen eine große Anzahl von Funktionen, wie oft wollen wir begrenzen die Rechenzeit. Die Anzahl der features verfolgen oft sollte man empirisch abgestimmt für jede Anwendung. Oft wird das Bild aufgeteilt in regelmäßigen sub-Regionen und in jedem der n stärksten features gespeichert werden, um zurückverfolgt werden. n ist in der Regel so gewählt, dass insgesamt etwa 500~1000 Merkmale ermittelt pro Bild.

Referenzen

Lesen Sie die journal paper beschreibt SURF wird definitiv geben Ihnen eine gute Vorstellung davon, wie es funktioniert. Versuche einfach, nicht bekommen, stecken in den details, besonders wenn Ihr hintergrund ist nicht in der computer vision oder Bildverarbeitung. Der SURF-Detektor mag extrem Roman auf den ersten Blick, aber die ganze Idee ist es, die Einschätzung der hessischen operator (ein gut etabliertes filter) mit integral-Bilder (die verwendet wurden, durch andere Methoden, lange bevor SURF). Wenn Sie verstehen wollen, SURFEN sehr gut, und Sie sind nicht vertraut mit der Bildbearbeitung, Sie müssen gehen Sie zurück und Lesen einige einleitende material. Vor kurzem stieß ich auf ein neues und kostenloses Buchderen Kapitel 13 hat eine gute und kurze Einführung in die feature-Erkennung. Nicht alles, was gesagt, ist technisch korrekt, aber es ist ein guter Ausgangspunkt. Hier finden Sie eine weitere gute Beschreibung, SURFEN mit mehreren Bildern, die zeigen, wie jeder Schritt funktioniert. Auf dieser Seite siehst du dieses Bild:

Können Sie sehen, die weißen und schwarzen blobs, das sind die blobs, SURF ermittelt in mehreren Skalen und schätzt Ihre Größe (radius in die OpenCV-code).

InformationsquelleAutor der Antwort fireant
5
1. "Größe" ist die Größe der Bereich, der durch den Deskriptor in das ursprüngliche Bild (es ist erhalten durch die Neuberechnung des original-Bildes in der scale-space, damit Sie variiert von Punkt, den wichtigen Punkt, basierend auf Ihrer Skala).
2. "response" ist in der Tat ein Indikator, wie "gut" (grob gesagt, in Bezug auf die-Ecke-ness) ein Punkt ist.
3. Guten Punkte sind stabil für statische Szene retrieval (dies ist der Hauptzweck des SIFT/SURF-Deskriptoren). Im Falle des tracking, können Sie haben gute Punkte erscheinen, weil das verfolgte Objekt befindet sich auf einem gut gestalteten hintergrund, der halb im Schatten... dann verschwinden, weil dieser Zustand hat sich verändert (Wechsel von Licht, Okklusion...). Es gibt also keine Garantie für die Verfolgung von Aufgaben, die ein guter Punkt, werde es immer sein.
InformationsquelleAutor der Antwort sansuiso

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.

Größe und Reaktion

Welche Funktionen auf die Spur?

Referenzen