18-02 「背景認識」という手段で誤認識を減らす
●3クラスだけで進むと誤認識が多くなる
人・自動車・バイク、3クラスの画像が揃ったら早速、学習→推論→FPGAに実装と行きたいところですが、実際にやってみると図18-07のように「誤認識」で画面が埋め尽くされてしまいます(*1)。
(*1)BはBike、CはCar、HはHuman。ノートパソコンに画像を映してカメラで撮っている。背景が「ヒト」と認識されてしまっている |
図18‐07 背景がHで埋め尽くされる。これではダメ
●背景は背景として認識させる
このような誤認識を避けるため、新たに「背景」のクラスを追加します。まずは"white"クラスを設けて白っぽい画像を用意します。図18‐08のように評価用のフォルダに3個の画像を置きます。 |
図18-08 白画像3枚(val_1\white)。微妙に色が違う
●訓練用は枚数が多い
訓練用には24枚用意しました(図18‐09)。フォルダ名は"3"とします。完全な真っ白ではなく、ある程度バリエーションを持たせる方が良いと思います。 |
図18-09 train_1フォルダの"3"に置く
●黒とベージュも用意する
黒の背景画像も用意します(図18‐10(a))。また背景にありがちな色(同図(b)ではベージュ)も用意するとよいでしょう。 |
図18-10(a)
図18-10(b)
●背景が変化する部分も認識させる
更に図18‐11のように白→黒と変化する背景画像も用意します。また逆のパターン黒→白も用意します。 |
図18-11 白→黒。その逆も用意する
●上から下の変化も認識させる
図18‐12のように縦に白→黒と変化する背景画像も用意、そして逆のパターン黒→白も用意します。
このように背景画像を計7クラス追加し、動くもの(人・自動車・バイク)の3クラスと合わせて10クラスになります。 |
図18-12 この逆パターンも用意。背景は計7クラス
次のページへ
目次へ戻る
|