生成AI時代のディープラーニング～セミナサポートサイト

2-06　ステップ３：未知の画像に適用して実用性を確認

　またロードマップ（図2-10）に戻りましょう。これから一番下、「未知の画像」の推論になります。ラベルリストはないので、正解／不正解は目視で判断することになります。

●大きな画像から小さなボールを探し出してみる

　前節までの学習、推論用プログラムは推論対象が30×30画素でしたが（＊４）、本節では640×480画素の画像を推論します。図2‐28のようにballs01.jpg, balls02.jpgをアップロード、さらにballs_still_pred_colab.pyをアップロードして実行します。

図2‐28　PythonプログラムとJPEGファイルをアップロード

●大きな画像を小さく分割してすべて推論する

　図2‐29はその結果です。このように640×480画素を1ブロック30×30画素で分割し、横方向に20ブロック、縦方向16ブロックとします（横方向はブロック間2画素の「隙間」ができる）。20×16＝320ブロックすべてにCNNが適用されます。

図2‐29　背景が誤認識だらけ

●ボールはうまく認識されているが…

　同図ではカラーボールが4個（赤／緑／青／黄）あります。それぞれR/G/B/Yと上書きされており、これらは正解です。ただ背景（床、フローリング）がすべて”R”と上書きされており、これらは「誤認識」ということになります。

●誤認識が多くてこのままでは実用的でない

　このように背景の色が赤っぽいと「赤色ボール」と認識されてしまいます。図2-01のようなロボットコンテスト（ボールの色を見分けてピックアップする）には都合が悪くなります。

次のページへ

目次へ戻る