20-02 背景認識の効果を見る

●推論用のフォルダ名を変える。学習用はそのまま

 前処理(MNISTの画像ファイル化→分類)のPythonプログラムを学習用、推論用、それぞれ走らせます。その後、
推論用のフォルダ名を 0, 1, 2,... 9 から zero, one, two,... nine に変更します(学習用はそのまま)。

 図20‐07を見ると zero, one, two,... nine に加えて
white, black, bk2wh...といったフォルダがありますが、これらは「背景認識」に使用する画像を含みます。

図20-07 推論用画像のフォルダ名。背景画像もある

●数字の画像だけで学習を行うと…

 もし「背景認識」をしなかったらどうなるでしょうか。0〜9の「数字のみ」で学習→推論を行った一例を図20‐08に示します。同図を見ると背景、特に「境界」の部分に「
誤認識」が多々見られます。

図20-08 境界部が4、1、7、2などと認識されている

背景認識で誤認識を減らす

 したがって背景は背景として認識させます。さらに認識結果を表示する際、「背景の認識」は
非表示にします(図20‐09)。図20‐08と比べるとずいぶんスッキリしています。

図20-09 境界部の誤認識が消えた!

境界部は数字ではなく背景として認識

 ちなみに「背景の認識」も表示させると図20‐10のようになります。境界の部分 (wh2bk, bk2wh, wh_bk, bk_wh) が「
背景」として認識されていることが分かります。

図20-10 WK、KWなど「背景認識」を表示してみる。Kは黒という意味(blacK)

●背景画像は学習用に数十枚あればよい

 図20‐11に背景認識の画像を例示します。「真っ白」 「白→黒」 「黒↓白」など、推論用は各クラス
3枚づつです(微妙に色合いが違う)。
 ちなみに学習用は各クラス
24枚づつ、背景認識ならこれくらいの枚数を用意すれば間に合うと思います。
真っ白 (white)
白→黒 (wh2bk)
黒↓白 (bk_wh)
図20-11 背景画像の一例。少ない枚数でも効果がある

次のページへ

目次へ戻る