Stable Diffusion自体は1年程前に環境構築をしてみてRTX 2060 SUPERでは思ったような生成ができず放置していました。
今回、RTX 4070グラフィックボードを購入したので本格的に環境構築をしてみようと思い、窓の杜で紹介されていた『Stability Matrix』を試してみることにしました。
Stability Matrixのメリット
- 導入が非常に簡単
- Pythonのバージョン管理が不要になる
- ディスク容量を圧迫しがちなAIモデルを、複数のWebUIで共通管理できる
Stability Matrixのインストール
ここから、最新バージョンの『StabilityMatrix-win-x64.zip』をダウンロード・解凍して『StabilityMatrix.exe』を実行。
『次の約款を読み、同意します』にチェックを入れて『続ける』をクリック
データフォルダを選択するのだが、この手のアプリケーションはファイルパスに『空白(スペース)』と『日本語文字』があるとトラブルの原因になるので、念のため気を付ける。
私はM.2 SSDのXドライブ直下にStability Matrixフォルダを作り、その中にデータフォルダを作成した。
『Portableモード』にチェックを入れると全てのデータと設定がアプリケーションと同じフォルダに保存されることになる。私はバックアップや環境移動の時に便利なのでチェックを入れたがお好みで。
次にインストールするUIを選択する。
今回はとりあえず基本のStable Diffusion WebUIを選択。
2024年現環境だとVRAM周りの処理が改善され高速化が期待できる『Stable Diffusion WebUI Forge』を利用したほうが良いので後で追加しておこう。
推奨Modelのインストール。スキップして自分の使いたいモデルを突っ込んでも良い。
今回は折角RTX 4070を導入したのでStable Diffusion XL(SDXL)用のアニメ調モデル『Animagine XL V3』をインストール。
ダウンロードとインストールには3~4時間くらい掛かったので気長に待とう。
完了後Launchタブへ移動して、プルダウンメニューから起動したいUIを選択、左側の『Launch』ボタンを押すとStable Diffusionが起動する。
ブラウザが起動し、いつものUIが表示されるのでとりあえず適当なプロンプトを打ち込んで生成してみる。
注意点としてSDXLモデルはデフォルトの画像サイズ512×512では乱れた画像が生成されてしまうので1024×1024で生成をする。
以上で環境構築が完了した。
Stability MatrixへモデルやLoraの追加など
メニューの『Checkpoints』タブの各種項目へドラッグ&ドロップするだけで、全てのUIで利用できる。
カテゴリのタブから必要な項目のオン・オフができるため、使用頻度の高い以下の項目はチェックを入れておくと良い。
- StableDiffusion(Base Models)
- VAE
- Lora
- LyCORIS
- ControlNet
- TextualInversion(Embedding):EasyNegativeなどを入れる
『Model Browser』タブからCivitAIとHugging Faceで検索してインストールすることもできる。
メタデータに対応しているモデルは、メニューバー上部または各モデルの右クリックからメタデータを取得しておけばアップデートやサムネイルの取得などをしてくれるので今後の管理がしやすくなる。雲のアイコンが緑色になり『メタデータ取得済みモデル』になればOK。
通常版と同じくモデルと同名の画像ファイルを突っ込めば好きな画像でサムネイル表示も可能。
まとめ
1年前に比べて環境構築が非常に簡単になっているのでこれから生成AIを始めてみようと思う人には良い環境だと思います。
そしてRTX 4070の生成能力の高さにも感動しました。少し値段は高いですが初期投資する価値はあります。