Was ist die Tiefe des convolutional neural network?

Ich war einen Blick auf das Convolutional Neural Network von CS231n Convolutional Neural Networks for Visual Recognition. In Convolutional Neural Network, das sind die Neuronen angeordnet in 3 Dimensionen(height, width, depth). Ich habe ein Problem mit der depth des CNN. Ich kann nicht visualisieren, was es ist.

In der link Sie sagte The CONV layer's parameters consist of a set of learnable filters. Every filter is small spatially (along width and height), but extends through the full depth of the input volume.

Beispielsweise loook auf dieses Bild. Sorry, wenn das Bild ist zu beschissen. Was ist die Tiefe des convolutional neural network?

Ich kann, die Idee zu begreifen, dass wir einen kleinen Bereich aus dem Bild, dann vergleichen Sie es mit dem "Filter". Also der Filter wird die Sammlung von kleinen Bildern? Auch Sie sagte We will connect each neuron to only a local region of the input volume. The spatial extent of this connectivity is a hyperparameter called the receptive field of the neuron. So ist das rezeptive Feld hat die gleiche dimension wie der Filter? Auch was die Tiefe der hier? Und was tun wir abrufen, erklären sich mit der Tiefe von CNN?

So, meine Frage ist vorallem, wenn ich ein Bild mit dimension der [32*32*3] (Lets sagen, ich habe 50000 dieser Bilder, so dass die dataset -[50000*32*32*3]), was soll ich wählen, der in seiner Tiefe und was würde es bedeuten, von der Tiefe. Auch was die dimension der Filter?

Außerdem wird es sehr hilfreich wenn jemand einen gewissen link, dass einige die intuition auf diese.

BEARBEITEN:
So wird in einem Teil des Tutorials(Real-world-Beispiel-Teil), es sagt The Krizhevsky et al. architecture that won the ImageNet challenge in 2012 accepted images of size [227x227x3]. On the first Convolutional Layer, it used neurons with receptive field size F=11, stride S=4 and no zero padding P=0. Since (227 - 11)/4 + 1 = 55, and since the Conv layer had a depth of K=96, the Conv layer output volume had size [55x55x96].

Hier sehen wir die Tiefe ist in der 96. So ist die Tiefe etwas, das ich wähle willkürlich? oder etwas, was ich berechnen? Auch im obigen Beispiel(Krizhevsky et al) hatte Sie 96 tiefen. Also, was bedeutet es, indem seine 96 Tiefe? Auch das tutorial erklärt Every filter is small spatially (along width and height), but extends through the full depth of the input volume.

Also das bedeutet, dass die Tiefe wird wie diese? Wenn ja, dann kann ich davon ausgehen Depth = Number of Filters?
Was ist die Tiefe des convolutional neural network?

InformationsquelleAutor Shubhashis | 2015-08-30
Schreibe einen Kommentar