1-04 オリジナルのPythonでSSD

 図1‐20に当該書籍(2章)のSSDのブロック図を示します。C3は3x3フィルタの畳み込み層、C1は1x1フィルタの畳み込み層、RはReLU、Pはプーリングを示します。畳み込み層はvggが15層、extrasが8層、confが6層、locが6層、計35層にわたります。MNISTが計8層だったことを考えると大変複雑なことが分かります。



図1‐20 SSDのブロック図


●まずは普通にPythonを実行する

 当該書籍のPythonプログラムをそのまま実行します。当然ですがプログラム内の画素データや重み係数は整数ではなく小数になっています。

 その結果は図1‐06〜13のようになります。このように「どこに」、「何が」存在するかを推論するのがSSD物体認識です。(*1)

(*1)ディープラーニングには「学習」と「推論」があるが、本企画では後者を行う。すなわち学習済みであり、重み係数はすでに用意されている。


目次へ戻る