2-03 source1+L2Nomの省略

 このブロック図の上段、畳み込みvgg10層目の出力はL2Normに入力され、source1が生成されています。
 source1, source2,... source6まで6つありますが、SSDにおいてsouce1は一番小さい領域の特徴量、souce6は一番大きい領域の特徴量を有しています(当該書籍の82ページ参照)。


●source1が行くのはconf1層目だけ

 上記ブロック図を見るとsource1は「locの1層目」と「confの1層目」に入力されます。loc層は前節で省略したので、
confの1層目の重み係数を0にすれば、source1はないのと一緒になります。

 そこでPythonをリスト2‐03のように変更します。


リスト2‐03 confの1層目の重み係数を0に


●小さな物体の検出はあきらめるという選択

 Pythonを変更する前に実行した結果を図2-11、変更した後の結果を図2‐12に示します。このように小さな物体(
自動車3台)は認識されていませんが、大きな物体(人と馬)に関しては同じ認識結果になります。


図2-11 Python変更前(source1あり)


図2-12 Python変更後(source1なし)

 またsouce1がなくても良いのなら、L2Normも必要ないことが分かります(L2Normは大雑把に言って標準偏差から偏差値を求めるような処理)。
 
すなわち本節ではconf1の1層目およびL2Normを省略したことになります。さらにアルゴリズムがシンプルになりました。


目次へ戻る