1-04 畳み込み4層+全結合2層で認識(続き)
●2層目、4層目にはプーリングがある
4層目の出力には2層目と同じようにプーリングが施されます。図1‐38のように画素が間引かれて、9×9だったものが4×4になります(*1)。
(*1)同図の9×9のグレーの部分を捨てて8×8とした後、縦横半分して4×4画素にする。 |
図1-38 4層目のプーリング。右と下の画素は捨てるので注意
●4層目の仕様は次のようになります(プーリング後)
入力: 11×11画素、64ch
出力: 4×4画素、128ch
係数: 64×128×9=73728個
●5層目からは全結合型になる
4層目の出力を横一列に並べたものが5層目の入力になります(*2)。図1‐39のように各チャネルの左上の画素を128チャネルぶん、そのあとは右隣の画素を128チャネルぶん…といった感じで2048個を並べます。
(*2)5層目以降は全結合型になるので一列にする。 |
図1-39 並べ方に注意
●全結合層は単純な行列演算
5層目では図1‐40のように1x2048の行列に2048x128の行列を乗算します。その結果、出力は1x128になります。
●5層目は次のような仕様になります(全結合型)
入力: 1x2048画素、1ch
出力: 1x128画素、1ch
係数: 2048x128=262144個(この層が一番係数が多い) |
図1-40 5層目は係数の数が多いので注意
●6層目は最終層
5層目の出力は6層目の入力になります。6層目では図1‐41のように1x128の行列に128x43の行列を乗算します。その結果、出力は1x43になります。
●6層目は次のような仕様になります(全結合型)
入力: 1x128画素、1ch
出力: 1x43画素、1ch
係数: 128x43=5504個 |
図1-41 最終的に43個の値が残る
次のページへ
目次へ戻る
|