2-06 ステップ3:未知の画像に適用して実用性を確認

図2‐28 PythonプログラムとJPEGファイルをアップロード
●大きな画像を小さく分割してすべて推論する
図2‐29はその結果です。このように640×480画素を1ブロック30×30画素で分割し、横方向に20ブロック、縦方向16ブロックとします(横方向はブロック間2画素の「隙間」ができる)。20×16=320ブロックすべてにCNNが適用されます。 |

図2‐29 背景が誤認識だらけ
●ボールはうまく認識されているが…
同図ではカラーボールが4個(赤/緑/青/黄)あります。それぞれR/G/B/Yと上書きされており、これらは正解です。ただ背景(床、フローリング)がすべて”R”と上書きされており、これらは「誤認識」ということになります。
●誤認識が多くてこのままでは実用的でない
このように背景の色が赤っぽいと「赤色ボール」と認識されてしまいます。図2-01のようなロボットコンテスト(ボールの色を見分けてピックアップする)には都合が悪くなります。 |
次のページへ
目次へ戻る |