1-04 畳み込み4層+全結合2層で認識(続き)

●2層目、4層目にはプーリングがある

 4層目の出力には2層目と同じように
プーリングが施されます。図1‐38のように画素が間引かれて、9×9だったものが4×4になります(*1)。

(*1)同図の9×9のグレーの部分を捨てて8×8とした後、縦横半分して4×4画素にする。

図1-38 4層目のプーリング。右と下の画素は捨てるので注意

●4層目の仕様は次のようになります(プーリング後)

 入力: 11×11画素、64ch
 出力: 4×4画素、128ch
 係数: 64×128×9=73728個


●5層目からは全結合型になる

 4層目の出力を横一列に並べたものが
5層目の入力になります(*2)。図1‐39のように各チャネルの左上の画素を128チャネルぶん、そのあとは右隣の画素を128チャネルぶん…といった感じで2048個を並べます。

(*2)5層目以降は全結合型になるので一列にする。

図1-39 並べ方に注意

●全結合層は単純な行列演算

 
5層目では図1‐40のように1x2048の行列に
2048x128の行列を乗算します。その結果、出力は1x128になります。


5層目は次のような仕様になります(全結合型)

 入力: 1x2048画素、1ch
 出力: 1x128画素、1ch
 係数: 2048x128=262144個(この層が一番
係数が多い

図1-40
5層目は係数の数が多いので注意

6層目は最終層

 5層目の出力は
6層目の入力になります。6層目では図1‐41のように1x128の行列に128x43の行列を乗算します。その結果、出力は1x43になります。


●6層目は次のような仕様になります(全結合型)

 入力: 1x128画素、1ch
 出力: 1x43画素、1ch
 係数: 128x43=5504個

図1-41 最終的に43個の値が残る


次のページへ


目次へ戻る