18-02 「背景認識」という手段で誤認識を減らす

●3クラスだけで進むと誤認識が多くなる

 人・自動車・バイク、3クラスの画像が揃ったら早速、学習→推論→FPGAに実装と行きたいところですが、実際にやってみると図18-07のように「誤認識」で画面が埋め尽くされてしまいます(*1)。

(*1)BはBike、CはCar、HはHuman。ノートパソコンに画像を映してカメラで撮っている。背景が「ヒト」と認識されてしまっている

図18‐07 背景がHで埋め尽くされる。これではダメ

●背景は背景として認識させる

 このような誤認識を避けるため、新たに「
背景」のクラスを追加します。まずは"white"クラスを設けて白っぽい画像を用意します。図18‐08のように評価用のフォルダに3個の画像を置きます。

18-08 白画像3枚(val_1\white)。微妙に色が違う

●訓練用は枚数が多い

 訓練用には24枚用意しました(図18‐09)。フォルダ名は"3"とします。完全な真っ白ではなく、ある程度バリエーションを持たせる方が良いと思います。

図18-09 train_1フォルダの"3"に置く

●黒とベージュも用意する

 黒の背景画像も用意します(図18‐10(a))。また背景にありがちな色(同図(b)ではベージュ)も用意するとよいでしょう

図18-10(a)

図18-10(b)

●背景が変化する部分も認識させる

 更に図18‐11のように白→黒と変化する背景画像も用意します。また逆のパターン黒→白も用意します。

図18-11 白→黒。その逆も用意する

●上から下の変化も認識させる

 図18‐12のように縦に白→黒と変化する背景画像も用意、そして逆のパターン黒→白も用意します。
 このように背景画像を計7クラス追加し、動くもの(人・自動車・バイク)の3クラスと合わせて
10クラスになります。

図18-12 この逆パターンも用意。背景は計7クラス

次のページへ

目次へ戻る