1-04 AIでサルの画像を1枚生成
●Google ColabのGPUを使って生成!
図1-13のように、ノートブックの「ランタイム」メニューから「ランタイムのタイプを変更」を選択します。すると図1-14のような画面が現れるので、”T4
GPU”を選択して保存します。これでエヌビディア製の高性能GPUが使えるようになります。 |

図1‐13 生成AIでGPUを使う準備

図1‐14 T4 GPU(エヌビディア製高性能GPU)
●diffusersなどインストール
生成AIを使うためにツール類をインストールします。図1-15のように” !pip
install diffusers transformers accelerate”(最初に"!"が付く)とタイプして実行します。図1-16のようにSuccessfully
installed…と出たら成功です |

図1‐15 コマンドセルにこのようにタイプ

図1‐16 インストールには数分かかる
●生成AIの設定用Pythonプログラム
コマンドセルにリスト1‐01のようにタイプして実行します。diffusers(*7)という仕組みでStable Diffusionを使います。画像生成用モデルはSG161222/Realistic_Vision_V2.0(*8)を使います。
また”cuda”の部分は「GPUを使って画像生成をする」という意味なので、GPUが使えない環境ではここでエラーが出ます。
(*7)diffusers: Web UIなしでStable Diffusionを使うためのライブラリ。無料版Google
ColabでStable Diffuison Web UIを使おうとすると警告が表示される。このサイトを参考にした。
(*8)Realistic_Vision_V2.0: 画像生成用モデルの一つ。実写的な画像を生成するのに適している。このサイトに説明あり。
|

リスト1‐01 diffusersからStable Diffusionを使う
●AIはpromptを解釈して画像を生成する
リスト1‐02ではpromptで「何を生成したいか」を記述します。”Japanese macaque”は「ニホンザル」の英語名です。”full body”と合わせて「ニホンザルの全身の画像」を生成したいと指示しています。 |

リスト1‐02 ニホンザル(Japanese Macaque)の画像生成
●negative_promptがないとオカルト的な絵に…
同リストのnegative_promptでは逆に「生成したくない要素」を記述します。これがないと「妙な絵」になる可能性が高くなります。sketch,
cartoonなどありますが、これらは生成用モデル(*8)のサイトにあるNegative
Prompt例を参考にしたものです。 |
●カメラ目線でほほ笑む(?)イケメンサル
実行した結果を図1‐17に示します。まるで写真のようですね。なおこれは「一例」でして、実行するたびに結果は変わります。同図のような見事な画像になるとは限らず、「失敗作」になることも多々あります。同図左のように”nihonzaru_org.jpg”が現れるので、「成功作」になったら忘れずに右クリックでダウンロードしましょう。 |

図1‐17 成功したら忘れずに保存しよう
次のページへ
目次へ戻る |