前橋工科大学 - デザイン演習 IVc 2022

Stable Diffusionで遊んでみる

November 22, 2022

今年 (2022年) は、機械学習による画像生成の技術に大きなブレイクスルーがありました。特に拡散生成モデルによる画像生成は、今までになかった高精細で高精度の画像をテキストやイメージから生成することが可能です。(参考 : Image Synthesis 画像生成)

拡散生成モデルによる画像生成の実装のひとつStable DiffusionはGoogle Colaboratoryで気軽に体験可能です。以下の手順で試していきましょう。

diffusersを用いたStable Diffusionの利用手順

1. (もし無ければ) Googleアカウントを作成

Googleアカウント作成

2. Hugging Faceにアカウント作成

Hugging Faceは様々な機械学習や自然言語処理を対象としたオープンソースのコミュニティです。今回はここから公開されている学習モデルを使用します。以下からアカウントを作成してください。右上の「sign up」ボタンから登録していきます。

Hugging Face

3. Hugging Faceトークン発行

Google Colaboratoryで使用するトークンを発行します。以下のページを参考にアクセストークンを発行してください。その際に

Name : notebooks
Role : write

にするようにしてください。

アクセストークンの発行手順 (Hugging Face)

4. Stable Diffusionのモデルのライセンス条項に同意する

今回使用するノートブックは、Stable Diffusion v1-4を使用しています。発行したトークンで利用するには、ライセンス条項などに同意する必要があります。下記のページからライセンス条項を確認した上で、「I have read the License and agree with its terms」にチェックを入れて、「Access repository」ボタンをクリックしてください。

CompVis/stable-diffusion-v1-4 · Hugging Face

5. diffusersのノートブックで画像生成!

以下のGoogle Colaboratoryのノートブックを実行していくと、画像が生成可能です。いろいろなテキストや生成方法を試してみましょう! ※途中でアクセストークンを入力する必要があります。3で発行したアクセストークンを使用してください。

Stable Diffusion with diffusers