2-06 ステップ3:未知の画像に適用して実用性を確認

 またロードマップ(図2-10)に戻りましょう。これから一番下、「未知の画像」の推論になります。ラベルリストはないので、正解/不正解は目視で判断することになります。


●大きな画像から小さなボールを探し出してみる

 前節までの学習、推論用プログラムは推論対象が30×30画素でしたが(*4)、本節では640×480画素の画像を推論します。図2‐28のようにballs01.jpg, balls02.jpgをアップロード、さらにballs_still_pred_colab.pyをアップロードして実行します。


図2‐28 PythonプログラムとJPEGファイルをアップロード

大きな画像を小さく分割してすべて推論する

 図2‐29はその結果です。このように640×480画素を1ブロック30×30画素で分割し、横方向に20ブロック、縦方向16ブロックとします(横方向はブロック間2画素の「隙間」ができる)。20×16=320ブロックすべてにCNNが適用されます。

図2‐29 背景が誤認識だらけ

●ボールはうまく認識されているが…

 同図ではカラーボールが4個(赤/緑/青/黄)あります。それぞれR/G/B/Yと上書きされており、これらは正解です。ただ背景(床、フローリング)がすべて”R”と上書きされており、これらは「誤認識」ということになります。


●誤認識が多くてこのままでは実用的でない

 このように背景の色が赤っぽいと「赤色ボール」と認識されてしまいます。図2-01のようなロボットコンテスト(ボールの色を見分けてピックアップする)には都合が悪くなります。


次のページへ

目次へ戻る