2-03 ディープラーニング(画像認識)のロードマップ

 図2-10にカラーボール認識のロードマップを示します。まず学習用画像セットをGoole Colabにアップロードし、ディープラーニングの「学習」を行います。

 学習により生成された「学習済みモデル」を「推論用画像セット」に適用して「推論」を行います。そして推論結果を「ラベルリスト」と照合し、認識率を求めます。

 最後に「未知の画像」を推論します。この際ラベルリストはなく、推論結果の正誤は目視で判断し、学習済みモデルの実用性を確認します。


図2‐10 ロードマップ〜Google Colabで学習→推論する


アルゴリズムはシンプルな6層CNN

 ディープラーニングの手法として、CNN(Convolutional Neural Network、畳み込みニューラルネットワーク)があります。今回は畳み込み層4層、全結合層2層のCNN(*3)で画像認識します。

(*3)その仕組みはインターフェース誌2025年2月号、生成AI×エッジ・デバイス連載3回目で説明。ここに原稿図面を置きます。

(*4)Pythonプログラム内で30x30画素にリサイズする(実際の画像より一回り小さくする)


次のページへ

目次へ戻る