Diffusion Beeというアプリを使えば、Apple Silicon Mac上でStable Diffusion機械学習モデルをローカルに実行し、AI生成アートを作成できます。使い方は以下のとおりです。
Stable Diffusionは、デジタルアート作品の生成に使用できるテキスト読み上げ機械学習モデルです。例えば、「シルクハットをかぶって自転車に乗っているサル」と入力すると、その画像が生成されます。
近年、機械学習モデルの改良に伴い、AIを用いたアート制作が人気を集めています。Stable Diffusion(安定拡散)はそうしたモデルの一つであり、DALL-EやMidjourneyなどもその一つです。
Diffusion Beeは、M1 MacでStable Diffusionをローカルに実行する最も簡単な方法として宣伝されています。GitHubでホストされているワンクリックインストーラーで、Stable Diffusionをコンピュータ上でローカルに実行できます。
Diffusion Beeアプリ
モデルの重みとソフトウェアアップデートのインストールをアプリがリクエストする場合を除き、クラウドにデータは送信されません。ソフトウェアへの依存関係は必要ありません。アプリのサイズは561MBです。
システム要件
- M1 または M2 Mac
- 最適なパフォーマンスを得るには16GBのRAMが必要です。8GBのRAMでは動作が遅くなる可能性があります。
- macOS Monterey 12.5.1 以降。
Diffusion Beeを使用するには、アプリをダウンロードしてインストールしてください。インストール後、アプリは2つの機械学習モデルをダウンロードします。1つ目のモデルは4GB、2つ目のモデルは341MBです。
Diffusion Beeで得られるものと期待できること
アプリを開いてモデルをインストールすると、アートのヒントを入力するためのテキストフィールドが表示されます。開発者によると、近日中に「Image to Image」カテゴリーも追加されるとのことなので、今のところはそのテキストフィールドをご利用ください。
画像のサイズとプロンプトによっては、画像の生成に時間がかかる場合があります。画像の生成が始まるまで、アプリを何度か強制終了する必要がありました。
ドロップダウンメニューから768ピクセルの最初のテキストプロンプトを生成するのに時間がかかりすぎたため、アプリを終了してしまいました。2回試行して強制終了した後、画像が表示されるようになりました。
詳細オプションには、画像の高さ、幅、ステップ、ガイドスケールのメニューがあります。ドキュメントを詳しく読まないと、後者2つが何を意味するのか分かりませんが、すべてデフォルトのままにしました。
テキスト プロンプトでは説明的な内容にすることが最善です。開発者が共有したサンプル画像では、「ゲーム オブ スローンズのハイブリッドの異種形態ドラゴンの写真、高詳細、フォトリアリスティック、artstation でトレンド、レイトレーシング」というプロンプトが使用されていました。
私たちは壮大なシーンを再現したかったので、「白馬に乗って鎌を持った黒猫を悪魔が追いかける。高精細、油絵風、写真のようにリアル」というテーマを掲げ、モデルからまさにそのようなシーンが生まれました。
そして私は見ていると、青白い馬がいた。それに乗っている者の名は「死の子猫」といい、地獄がそれに従っていた。
ArtHub.ai の Web サイトには、生成された画像とそのプロンプトが掲載されており、インスピレーションを得るために使用できる例がさらにたくさんあります。