2-03 source1+L2Nomの省略
このブロック図の上段、畳み込みvgg10層目の出力はL2Normに入力され、source1が生成されています。
source1, source2,... source6まで6つありますが、SSDにおいてsouce1は一番小さい領域の特徴量、souce6は一番大きい領域の特徴量を有しています(当該書籍の82ページ参照)。
●source1が行くのはconf1層目だけ
上記ブロック図を見るとsource1は「locの1層目」と「confの1層目」に入力されます。loc層は前節で省略したので、confの1層目の重み係数を0にすれば、source1はないのと一緒になります。
そこでPythonをリスト2‐03のように変更します。 |
リスト2‐03 confの1層目の重み係数を0に
●小さな物体の検出はあきらめるという選択
Pythonを変更する前に実行した結果を図2-11、変更した後の結果を図2‐12に示します。このように小さな物体(自動車3台)は認識されていませんが、大きな物体(人と馬)に関しては同じ認識結果になります。 |
図2-11 Python変更前(source1あり)
図2-12 Python変更後(source1なし)
またsouce1がなくても良いのなら、L2Normも必要ないことが分かります(L2Normは大雑把に言って標準偏差から偏差値を求めるような処理)。
すなわち本節ではconf1の1層目およびL2Normを省略したことになります。さらにアルゴリズムがシンプルになりました。 |
目次へ戻る
|