1-04 オリジナルのPythonでSSD
図1‐20に当該書籍(2章)のSSDのブロック図を示します。C3は3x3フィルタの畳み込み層、C1は1x1フィルタの畳み込み層、RはReLU、Pはプーリングを示します。畳み込み層はvggが15層、extrasが8層、confが6層、locが6層、計35層にわたります。MNISTが計8層だったことを考えると大変複雑なことが分かります。 |
図1‐20 SSDのブロック図
●まずは普通にPythonを実行する
当該書籍のPythonプログラムをそのまま実行します。当然ですがプログラム内の画素データや重み係数は整数ではなく小数になっています。
その結果は図1‐06〜13のようになります。このように「どこに」、「何が」存在するかを推論するのがSSD物体認識です。(*1)
(*1)ディープラーニングには「学習」と「推論」があるが、本企画では後者を行う。すなわち学習済みであり、重み係数はすでに用意されている。 |
目次へ戻る
|