1-09 データセットは画像が数千枚はないと実用的でない

 今回はロードマップ(図1-03)のようにAIで「背景画像3枚生成」、さらに「サル画像1枚生成」→画像加工で「サル画像3枚」としました。それらを合成した結果、画像は9枚となりました。


●画像をもっと増やしてディープラーニングするには・・・

 背景画像生成数(A)、サル画像生成数(B)、サル画像加工数(C)とすると、学習用画像はA×B×C枚となるので、枚数を増やすには以下が考えられます。

@画像加工のバリエーションを増やす。
 輝度の変更、色合い変更、ノイズ加算など、工夫次第でもう何倍か画像を増やせそうです。

A自力で背景画像/サル画像をたくさん撮影する。
 わざわざ山に行って本物のサルを撮影するのは大変なので、これは限界がありそうです。

BAIで背景画像/サル画像をたくさん生成する。
 Google ColabはGPUに使用制限があります。また実際にサル画像を生成してみると、成功作よりも失敗作が多かったりします。これも限界があると言わざるを得ません。


●生成AIのみで一からデータセットを作るのはまだ難しい

 ディープラーニングの学習には少なくとも数千枚の画像が必要と言われます。図1-03のような「認識対象と背景、どちらもAIで生成」といった手法では、残念ながら数千枚の画像を用意するにはまだ不十分のようです。

●生成AIをデータセットに活用するための現実的な手法

 今回はこれ(活用法1)でしたが、これ(同2)やこれ(同3)はより現実的な生成AIの活用法になります。

最初のページへ

目次へ戻る