生成AI時代のディープラーニング～セミナサポートサイト

1-04　AIでサルの画像を1枚生成

●Google ColabのGPUを使って生成！

　図1-13のように、ノートブックの「ランタイム」メニューから「ランタイムのタイプを変更」を選択します。すると図1-14のような画面が現れるので、”T4 GPU”を選択して保存します。これでエヌビディア製の高性能GPUが使えるようになります。

図1‐13　生成AIでGPUを使う準備

図1‐14　T4 GPU（エヌビディア製高性能GPU）

●diffusersなどインストール

　生成AIを使うためにツール類をインストールします。図1-15のように” !pip install diffusers transformers accelerate”(最初に"!"が付く)とタイプして実行します。図1-16のようにSuccessfully installed…と出たら成功です

図1‐15 コマンドセルにこのようにタイプ

図1‐16 インストールには数分かかる

●生成AIの設定用Pythonプログラム

　コマンドセルにリスト1‐01のようにタイプして実行します。diffusers（＊７）という仕組みでStable Diffusionを使います。画像生成用モデルはSG161222/Realistic_Vision_V2.0（＊８）を使います。
また”cuda”の部分は「GPUを使って画像生成をする」という意味なので、GPUが使えない環境ではここでエラーが出ます。

（＊７）diffusers：　Web UIなしでStable Diffusionを使うためのライブラリ。無料版Google ColabでStable Diffuison Web UIを使おうとすると警告が表示される。このサイトを参考にした。

（＊８）Realistic_Vision_V2.0：　画像生成用モデルの一つ。実写的な画像を生成するのに適している。このサイトに説明あり。

リスト1‐01　diffusersからStable Diffusionを使う

●AIはpromptを解釈して画像を生成する

　リスト1‐02ではpromptで「何を生成したいか」を記述します。”Japanese macaque”は「ニホンザル」の英語名です。”full body”と合わせて「ニホンザルの全身の画像」を生成したいと指示しています。

リスト1‐02　ニホンザル（Japanese Macaque）の画像生成

●negative_promptがないとオカルト的な絵に…

　同リストのnegative_promptでは逆に「生成したくない要素」を記述します。これがないと「妙な絵」になる可能性が高くなります。sketch, cartoonなどありますが、これらは生成用モデル（＊８）のサイトにあるNegative Prompt例を参考にしたものです。

●カメラ目線でほほ笑む（？）イケメンサル

　実行した結果を図1‐17に示します。まるで写真のようですね。なおこれは「一例」でして、実行するたびに結果は変わります。同図のような見事な画像になるとは限らず、「失敗作」になることも多々あります。同図左のように”nihonzaru_org.jpg”が現れるので、「成功作」になったら忘れずに右クリックでダウンロードしましょう。

図1‐17　成功したら忘れずに保存しよう

次のページへ

目次へ戻る