1-04 畳み込み4層+全結合2層で認識(続き)
●層が進むごとに画素数が減ってチャネル数が増える
1層目の出力は2層目の入力となり、図1‐34のように28×28画素が16chあります。そして2層目の出力は同図の下部のように26×26画素、32chになります(*1)。
(*1)3×3のカーネルの動く範囲は26×26なので一回り小さくなる。 |
図1-34 2層目(プーリング前)
●2層目はプーリングで画素数を1/4に
2層目の出力には「プーリング」が施されます。図1‐35のように26×26画素を間引いて13×13画素にする作業です(*2)。
(*2)近傍の4画素のうち最大のものを残して画素数を減らす。 |
図1-35 縦と横を半分に
●2層目の仕様は次のようになります(プーリング後)
入力: 28×28画素、16ch
出力: 13×13画素、32ch
係数: 16×32×9=4608個
●次は3層目。更に画素数が減ってチャネル数が増える
2層目の出力は3層目の入力になります。3層目は図1‐36のように出力が64chに増え、画素は一回り小さい11×11になります。 |
図1-36 3層目はプーリングなし
●3層目の仕様は次のようになります。
入力: 13×13画素、32ch
出力: 11×11画素、64ch
係数: 32×64×9=18432個
●4層目。最後の畳み込み層
3層目の出力は4層目の入力になります。4層目の出力は図1‐37のように128ch、9×9画素になります。 |
図1‐37 4層目。この後プーリングがある
次のページへ
目次へ戻る
|