Stable DiffusionのWeb UIは、画像生成AIを簡単に操作するためのユーザーフレンドリーなインターフェースです。この記事では、最も人気のあるAUTOMATIC1111版Web UIを使用して、ローカル環境にStable Diffusionをインストールする手順を詳しく解説します。AUTOMATIC1111版は、豊富な機能と拡張性があり、多くのユーザーに支持されています。
1. Web UIとは何か?
Stable Diffusion Web UIは、テキストプロンプトを入力して簡単に画像を生成できるグラフィカルインターフェース(GUI)です。コマンドライン操作に慣れていないユーザーでも、インターフェース上でテキストを入力し、様々な設定を行うだけで画像を生成できます。
AUTOMATIC1111版のWeb UIは特に人気があり、以下の特徴があります:
- txt2img機能:テキストから画像を生成する基本的な機能。
- img2img機能:既存の画像を元に新しい画像を生成する機能。
- Inpainting機能:画像の一部を修正したり、欠損部分を補完する機能。
- アップスケール機能:生成した画像を高解像度に拡大する機能。
- LORA、ハイパーネット、チェックポイントのカスタムサポート:さまざまなモデルやファインチューニングオプションをサポート。
2. リポジトリのクローン(Gitを使用)
Stable DiffusionのAUTOMATIC1111版Web UIをインストールするには、まずリポジトリ(コードベース)をクローンする必要があります。クローンとは、Gitを使って、オンラインのコードリポジトリから自分のローカルPCにその内容を複製する操作のことです。
以下の手順で進めます
- Git Bashを開く:
- Gitのインストールが完了していれば、デスクトップまたはスタートメニューから「Git Bash」を開きます。
- これで、コマンドラインからGitを使用する準備が整います。
- 作業ディレクトリを作成する:
- インストールするフォルダをあらかじめ作成し、そこに移動して作業を進めます。
- 例として、
C:\StableDiffusion
というフォルダを作成し、そのフォルダに移動します。mkdir C:\StableDiffusion cd C:\StableDiffusion
- リポジトリのクローン:
- 次に、Gitリポジトリをクローンします。以下のコマンドを実行して、AUTOMATIC1111のリポジトリをローカルにダウンロードします。
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
- このコマンドにより、
stable-diffusion-webui
というフォルダが作成され、その中に必要なファイルがダウンロードされます。
- 次に、Gitリポジトリをクローンします。以下のコマンドを実行して、AUTOMATIC1111のリポジトリをローカルにダウンロードします。
3. モデルファイルのダウンロード
Stable Diffusionを動作させるには、事前に学習されたモデルファイルが必要です。モデルファイルは、画像生成AIが学習したデータの集積であり、これを使用してテキストプロンプトに基づいた画像を生成します。
- モデルファイルの入手先:
- Stable Diffusionのモデルファイルは、Hugging Faceや他のコミュニティサイトから入手できます。多くのユーザーは、Hugging Faceのモデルリポジトリからv1.5またはv2.1バージョンのモデルをダウンロードします。
- モデルファイルのダウンロード:
- 以下の手順でモデルファイルをダウンロードし、適切なフォルダに配置します。
- Hugging Faceのサイトにアクセスし、「Stable Diffusion v1.5」または「v2.1」モデルファイルを選択します。
.ckpt
または.safetensors
形式のファイルをダウンロードします(数GBのサイズになる場合があるため、ダウンロードには時間がかかることがあります)。
- モデルファイルの配置:
- ダウンロードしたモデルファイルを、次のフォルダに移動します。
stable-diffusion-webui\models\Stable-diffusion\
- このフォルダにモデルファイルを置くことで、Stable Diffusion Web UIがそのモデルを使用して画像生成を行えるようになります。
- ダウンロードしたモデルファイルを、次のフォルダに移動します。
4. Web UIの起動
リポジトリのクローンとモデルファイルのダウンロードが完了したら、次はStable Diffusion Web UIを起動します。起動手順は非常にシンプルです。
- Web UIを起動:
- ダウンロードされた
stable-diffusion-webui
フォルダに移動し、webui-user.bat
というファイルをダブルクリックします(Windowsの場合)。 - このスクリプトが実行されると、必要なライブラリや依存関係が自動的にダウンロードされ、セットアップが進行します。
- 起動には数分かかる場合があります。すべての準備が整うと、次のようなメッセージが表示されます。
Running on local URL: http://127.0.0.1:7860
- ダウンロードされた
- ブラウザからアクセス:
- ブラウザを開き、アドレスバーに以下のURLを入力します。arduinoコードをコピーする
http://127.0.0.1:7860
- これで、Stable DiffusionのWeb UIが表示されます。画面にプロンプト入力欄があり、そこからテキストを入力して画像を生成することができます。
- ブラウザを開き、アドレスバーに以下のURLを入力します。arduinoコードをコピーする
5. 最初の画像生成
インターフェースが立ち上がったら、早速最初の画像を生成してみましょう。
- テキストプロンプトの入力:
txt2img
タブを選択し、テキストプロンプト欄に以下のように入力します。A beautiful anime girl with long pink hair, wearing a sailor uniform, smiling.
- 画像生成の設定:
- 必要に応じて、画像のサイズやサンプル数を設定します。最初はデフォルトの設定で試してみることをお勧めします。
- 生成ボタンをクリック:
- 「Generate」ボタンをクリックすると、Stable Diffusionがテキストプロンプトに基づいた画像を生成します。生成には数秒から数十秒かかります。
- 画像のプレビュー:
- 生成が完了すると、下部に生成された画像が表示されます。生成結果に満足しない場合は、プロンプトを変更して再度生成を試みます。
6. トラブルシューティング
インストールや起動時に問題が発生した場合は、以下の点を確認してください。
- 必要な依存パッケージのインストール:
- 起動時にエラーが発生した場合、依存パッケージが不足している可能性があります。この場合、
requirements.txt
ファイルを確認し、次のコマンドで必要なパッケージをインストールします。pip install -r requirements.txt
- 起動時にエラーが発生した場合、依存パッケージが不足している可能性があります。この場合、
- ファイアウォールの設定:
- Web UIが起動してもブラウザでアクセスできない場合は、ファイアウォール設定が原因でブロックされている可能性があります。ローカルネットワーク内でのアクセスを許可するように設定を確認してください。
- GPUドライバの確認:
- GPUに関するエラーが発生した場合、NVIDIAの最新ドライバがインストールされていることを確認してください。古いドライバでは、Stable Diffusionが正常に動作しない場合があります。
7. まとめ
Stable Diffusion Web UI(AUTOMATIC1111版)のインストールとセットアップは、シンプルな手順を踏むことで簡単に行うことができます。Gitを使ってリポジトリをクローンし、必要なモデルファイルを適切なフォルダに配置するだけで、Stable Diffusionの豊富な機能を活用して画像を生成できる環境が整います。AUTOMATIC1111版のWeb UIは、テキストプロンプトを使った画像生成に加えて、さまざまな追加機能をサポートしているため、初心者から上級者まで幅広く利用されています。
以下に、Web UIインストールの要点を再度整理します:
- リポジトリのクローン:Gitを使ってAUTOMATIC1111のリポジトリをダウンロード。
- モデルファイルのダウンロード:Hugging Faceなどのリソースからモデルファイルを取得し、適切なフォルダに配置。
- Web UIの起動:
webui-user.bat
を実行してローカル環境で起動し、ブラウザでアクセス。 - プロンプトの入力:テキストプロンプトを使って画像を生成し、設定を調整しながら理想の画像を作成。
トラブルシューティングも万が一必要になった際には、依存パッケージやファイアウォール、GPUドライバなどのチェックを行うことが推奨されます。
Stable Diffusionを正しくセットアップすることで、無限のクリエイティブな可能性が広がります。次の記事では、生成された画像の最適化や、プロンプトの応用テクニックについて詳しく解説していきます。