1-04 AIでサルの画像を1枚生成

●Google ColabのGPUを使って生成!

 図1-13のように、ノートブックの「ランタイム」メニューから「ランタイムのタイプを変更」を選択します。すると図1-14のような画面が現れるので、”T4 GPU”を選択して保存します。これでエヌビディア製の高性能GPUが使えるようになります。

図1‐13 生成AIでGPUを使う準備


図1‐14 T4 GPU(エヌビディア製高性能GPU)

●diffusersなどインストール

 生成AIを使うためにツール類をインストールします。図1-15のように” !pip install diffusers transformers accelerate”(最初に"!"が付く)とタイプして実行します。図1-16のようにSuccessfully installed…と出たら成功です

1‐15 コマンドセルにこのようにタイプ


図1‐16 インストールには数分かかる

生成AIの設定用Pythonプログラム

 コマンドセルにリスト1‐01のようにタイプして実行します。diffusers(*7)という仕組みでStable Diffusionを使います。画像生成用モデルはSG161222/Realistic_Vision_V2.0(*8)を使います。
また”cuda”の部分は「GPUを使って画像生成をする」という意味なので、GPUが使えない環境ではここでエラーが出ます。

(*7)diffusers: Web UIなしでStable Diffusionを使うためのライブラリ。無料版Google ColabでStable Diffuison Web UIを使おうとすると警告が表示される。このサイトを参考にした。

(*8)Realistic_Vision_V2.0: 画像生成用モデルの一つ。実写的な画像を生成するのに適している。このサイトに説明あり。

リスト1‐01 diffusersからStable Diffusionを使う

●AIはpromptを解釈して画像を生成する

 リスト1‐02ではpromptで「何を生成したいか」を記述します。”Japanese macaque”は「ニホンザル」の英語名です。”full body”と合わせて「ニホンザルの全身の画像」を生成したいと指示しています。


リスト1‐02 ニホンザル(Japanese Macaque)の画像生成

●negative_promptがないとオカルト的な絵に…

 同リストのnegative_promptでは逆に「生成したくない要素」を記述します。これがないと「妙な絵」になる可能性が高くなります。sketch, cartoonなどありますが、これらは生成用モデル(*8)のサイトにあるNegative Prompt例を参考にしたものです。

カメラ目線でほほ笑む(?)イケメンサル

 実行した結果を図1‐17に示します。まるで写真のようですね。なおこれは「一例」でして、実行するたびに結果は変わります。同図のような見事な画像になるとは限らず、「失敗作」になることも多々あります。同図左のように”nihonzaru_org.jpg”が現れるので、「成功作」になったら忘れずに右クリックでダウンロードしましょう。

図1‐17 成功したら忘れずに保存しよう

次のページへ

目次へ戻る