2-02 カラーボール画像セット作成の手順
(1) ランタイムの変更
画像セットの作成にはGoogle Colabを使用します。ここを参考にノートブックを開きましょう。また生成AIを使うので、ここを参考にT4 GPUを有効にします。
(2) ディレクトリ作成
コマンドセルに次のようにタイプしてディレクトリを生成します。
mkdir genFloor inBalls outBalls
mkdir tmp1 tmp2 tmp3 tmp4
mkdir train_1 val_1
mkdir train_1/0 train_1/1 train_1/2 train_1/3
mkdir val_1/red val_1/green val_1/blue val_1/yellow
|
(3) 背景生成
背景はAIで生成します。まずはdiffusersをインストール。
!pip install --upgrade diffusers accelerate transformers
generatefloor.txt この内容をコマンドセルにコピペして実行(1回目)
次のように変更して実行を繰り返します。
("./genFloor/0.jpg") -> ("./genFloor/1.jpg") に変更して実行(2回目)
("./genFloor/1.jpg") -> ("./genFloor/2.jpg") に変更して実行(3回目)
以上でgenFloorディレクトリに床画像(背景用)が3枚生成される(図2‐04)。 |


図2‐04 512×384画素の画像が3つ
(4) 背景分割
dividefloor.txt この内容をコマンドセルにコピペして実行
以上でtmp1ディレクトリに分割後の床画像が3×12=36枚(図2‐05) |

図2‐05 120×120画素の画像が36個
(5) ボール画像の背景切り取り(1回目)
inR/*.jpg これらを(一旦適当なディレクトリに展開してから)inBallsディレクトリにアップロード
次にrembgをインストール
!pip install rembg
さらにonnxruntimeもインストール
!pip install onnxruntime
removebg1.txt この内容をコマンドセルにコピペして実行
以上でtmp2ディレクトリに背景切り取りボール画像が6枚(図2‐06)
|

図2‐06 ボールの背景の切り取り
(6) ボール画像の変形
modifyballs.txt この内容をコマンドセルにコピペして実行
以上でtmp3ディレクトリに拡大縮小回転したボール画像が6×5=30枚
(7) ボール画像の背景切り取り(2回目)
removebg2.txt この内容をコマンドセルにコピペして実行
以上でtmp4ディレクトリに背景切り取りボール画像が30枚
(8) ボール画像と背景の合成
putballsonbg.txt この内容をコマンドセルにコピペして実行
以上でoutBallsディレクトリに背景と合成された画像が30×36=1080枚(図2‐07) |

図2‐07 背景と合成されたボール画像。赤だけで1080枚
(9) train, val(学習用、推論用)の振り分け
mv outBalls/*_11.png val_1/red (緑はval_1/green 青はval_1/blue 黄はval_1/yellow)
mv outBalls/*.png train_1/0 (緑はtrain_1/1 青はtrain_1/2 黄はtrain_1/3)
以上でtrain_1/0ディレクトリに学習用画像が990枚
以上でval_1/redディレクトリに推論用画像が90枚 |
この後(5)に戻る。inG inB inY/*.jpg をアップロード
(9)まで繰り返し。(9)はディレクトリに注意
赤/緑/青/黄色ボール画像生成したら(10)に進む |
(10) ボール画像ファイルの圧縮
!zip -r train_1.zip train_1
!zip -r val_1.zip val_1
生成したZIPファイルを右クリックでダウンロードする
なお、床のみの画像が欲しいときはtmp1内の画像を適当に学習用/推論用に振り分ける(ここで使用する) |
次のページへ
目次へ戻る |