1-04 畳み込み4層+全結合2層で認識(続き)

●層が進むごとに画素数が減ってチャネル数が増える

 1層目の出力は
2層目の入力となり、図1‐34のように28×28画素が16chあります。そして2層目の出力は同図の下部のように26×26画素、32chになります(*1)。

(*1)3×3のカーネルの動く範囲は26×26なので一回り小さくなる。

図1-34 2層目(プーリング前)

●2層目はプーリングで画素数を1/4に

 2層目の出力には「
プーリング」が施されます。図1‐35のように26×26画素を間引いて13×13画素にする作業です(*2)。

(*2)近傍の4画素のうち最大のものを残して画素数を減らす。

図1-35 縦と横を半分に

●2層目の仕様は次のようになります(プーリング後)

 入力: 28×28画素、16ch
 出力: 13×13画素、32ch
 係数: 16×32×9=4608個



●次は3層目。更に画素数が減ってチャネル数が増える

 2層目の出力は
3層目の入力になります。3層目は図1‐36のように出力が64chに増え、画素は一回り小さい11×11になります。


図1-36
3層目はプーリングなし

3層目の仕様は次のようになります。

 入力: 13×13画素、32ch
 出力: 11×11画素、64ch
 係数: 32×64×9=18432個



●4層目。最後の畳み込み層

 3層目の出力は
4層目の入力になります。4層目の出力は図1‐37のように128ch、9×9画素になります。


図1‐37 4層目。この後プーリングがある


次のページへ


目次へ戻る