【完全版】Stable Diffusionの公式&おすすめ派生モデル25選
高品質な画像をテキスト入力から生成できるオープンソースAIモデル「Stable Diffusion」。公式モデルは日々進化し、派生モデルも次々登場する中で、どのモデルが画像生成に適しているかわからない、という方も多いのではないでしょうか。
本記事では、Stable Diffusionのおすすめモデルを公式モデルからコミュニティ派生モデルまで、最新情報を交えて網羅的にご紹介します。
Stable Diffusion(ステイブルディフュージョン)がどのように進化してきたのか、どんなモデルがあり、どのように導入・活用するのがベストか、最新情報を知りたい方はぜひ最後までご覧ください。

AI導入.comを提供する株式会社FirstShift 代表取締役。トロント大学コンピューターサイエンス学科卒業。株式会社ANIFTYを創業後、世界初のブロックチェーンサービスを開発し、東証プライム上場企業に売却。その後、マッキンゼー・アンド・カンパニーにコンサルタントとして入社。マッキンゼー日本オフィス初の生成AIプロジェクトに従事後、株式会社FirstShiftを創業。
Stable Diffusionとは?
出典:Stable Diffusion
Stable Diffusionは、深層学習の拡散モデル(Diffusion Model)をベースとした画像生成AIです。
2022年に初期バージョンが公開されて以来、次々と派生モデルが登場し、アニメ・イラストやリアル写真風、芸術的表現などに特化したモデルが日々アップロードされています。
本記事ではStable Diffusionの数々のモデルの、選び方の解説やおすすめモデルの紹介記事になります。そもそもStable Diffusionの使い方について知りたいという方はこちらをご覧ください。
Stable Diffusionベースの画像生成AIモデルの数は?
Stable Diffusionをベースとした画像生成AIモデルの開発は非常に活発で、現在数百から数千のモデルが開発されていると言われています。
Hugging FaceやCivitaiといった画像生成AIの共有プラットホームに掲載されている画像生成AIモデルも、多くがStable Diffusionの派生モデルです。
数が非常に多い分選定するのはかなり難易度が高く、活用の際には適切なモデルをいかに見極められるかが重要となります。
画像生成AIモデルを選ぶ時の5つのポイント
画像生成を選ぶ際には、どのような観点で各モデルを評価すればいいのかを理解することが重要です。
ここでは具体的なモデル紹介に入る前に、画像生成AIモデルを選ぶ際の観点を5つ紹介します。
パラメータ数
モデルのパラメータ数は、生成される画像の品質や詳細度に直結します。大規模なパラメータを持つモデルほど、複雑な特徴や微細なテクスチャを生成する能力が高まります。
しかし、パラメータ数が多い場合は、トレーニングや推論に高い計算資源が必要となる点にも注意が必要です。
解像度
モデルが扱える最大解像度は、生成される画像の鮮明さや細部の表現に大きく影響します。高解像度のモデルほど、よりクリアでリアルな画像を生成することができます。
特に、特定の用途やデバイスに合わせた解像度の選択が重要です。
(学習済みモデルの場合)ベースに使われているモデル
提供されている学習済みモデルについては、どの公式モデルをベースにチューニングされたものなのかを確認することが肝要です。
良質なモデルはさまざまなスタイルやコンテンツの生成に対応し、カスタマイズやファインチューニングが容易です。そのため、適切なベースモデルが使われている画像生成AIは、品質や今後のメンテナンスの質も担保されやすいと言えます。
計算リソースの要件
画像生成AIを利用する上で注意する必要があるのが、モデルのトレーニングと推論に必要な計算リソースです。
リソース条件によって運用コストや利便性が大きく異なるため、選択するモデルが使用するGPUやTPUのタイプや数、メモリの容量がどの程度必要なのか、確認するようにしましょう。
情報共有エコシステムとサポートの充実性
モデルを提供するプラットフォームやコミュニティのエコシステムやサポートが整っているかどうかも考慮すべきです。
良好なサポートやドキュメンテーションがあると、開発やトラブルシューティングがスムーズに行えます。
Stable Diffusionの公開する10種類の公式モデル
Stable Diffusionは公式が公開しているものだけでも数種類のモデルが存在しています。
以下の表では、Stable Diffusion公式モデルの主なバージョンとその特徴をまとめています。
モデル名 | リリース時期 | パラメータ数 (概算) | 解像度 | 主な特徴 |
---|---|---|---|---|
Stable Diffusion 1.4 | 2022年8月 | 約9億 | 512×512 | 初期公開モデル。軽量かつ汎用性が高い。 |
Stable Diffusion 1.5 | 2022年10月 | 約9億 | 512×512 | 1.4を改良し、出力の鮮明さ・安定性を若干向上。 |
Stable Diffusion 2.0 | 2022年11月 | 約10億 | 768×768 | 新テキストエンコーダを採用し、解像度を拡張。アダルト画像フィルターを強化。 |
Stable Diffusion 2.1 | 2022年12月 | 約10億 | 768×768 | 2.0のマイナーアップデート。NSFWフィルタを緩和し、多様な生成が可能に。 |
Stable Diffusion XL (SDXL) | 2023年7月 | 約35億 | 1024×1024 | 解像度や手や文字の精度を大幅に向上。大型モデルでGPU要件が高い。 |
Stable Diffusion XL Turbo | 2023年11月 | 非公開 | 512×512 | SDXLの蒸留版で、少ない拡散ステップで高速な画像生成が可能。 |
Stable Diffusion 3.0 | 2024年2月(早期プレビュー) | 8億〜80億 | 1024×1024 | “Diffusion Transformer”へ移行し、文字生成などを向上。 |
Stable Diffusion 3.5 Large | 2024年10月 | 80億 | 1メガピクセル | 優れた品質と迅速な適合性を持ち、プロフェッショナルな用途に最適。 |
Stable Diffusion 3.5 Large Turbo | 2024年10月 | 非公開 | 1メガピクセル | 3.5 Largeの蒸留版で、高速な画像生成が可能。 |
Stable Diffusion 3.5 Medium | 2024年10月 | 25億 | 0.25〜2メガピクセル | MMDiT-Xアーキテクチャ採用で、カスタマイズ性と画質のバランスが良い。一般消費者向けハードウェアでの使用に最適。 |
StableDiffusionのモデルは大きく1系(1.4/1.5)、2系(2.0/2.1)、SDXL、SD3の4つの系統があります。ここから各系統の特徴を簡単にご紹介します。
1系(1.4/1.5)モデル
生成AI黎明期の2022年にリリースされたモデルで、軽量かつローカルでも動作可能な点が特徴です。512x512pxの小サイズの画像生成に特化しています
多くの拡張ツールやLoRAモデルがこのバージョンをベースにして開発されています。
2系(2.0/2.1)モデル
2系は1系のリリースから程なくして2022年末ごろに発表されたモデルで、解像度が768x768pxに向上し、ややリアル寄りの描画なのが特徴です。
一方で用途によっては1系に比べて再現性が低いケースもあり、利用者によって好みが分かれるモデルと言われています。
XL系(SDXL、SDXL Turbo)モデル
XL系は2023年にリリースされたモデルで、大幅なパラメータ数増加と1024x1024pxへの解像度向上により細部再現度が強化されています。
複雑な構図やリアルな質感表現に優れ**、商用レベルの生成精度**と市場評価も高いモデルとなっています。
また、文章の意味理解力が向上し、長めのプロンプトにも強いため、ユーザー目線での使い勝手も大幅に向上しています。
3.0モデル
SD3は2024年リリースのモデルで、マルチモーダル(画像+テキスト)理解に対応している点が特徴です。
生成品質も従来比で大幅に向上しており、文字の描写や複数人物の自然な配置も得意なため、SDXLと同じく商用に耐えうるスペックと評価されています。
3.5系(3.5 Large、3.5 Latge Turboなど)モデル
Stable Diffusion 3.5系は2024年末にリリースされた最新モデルで、高いカスタマイズ性と効率的なパフォーマンスを特徴としています。
3D、写真、絵画、線画など、多彩なスタイルの画像生成が高品質で行われており、今最も商用利用に向いているモデルであるとされています。
Stable Diffusion派生モデルのおすすめ15選
ここからは、Stable Diffusionの公式モデルを元に構築された派生モデルの中から、15の人気おすすめモデルをジャンル別に紹介します。
派生モデルのおすすめ【アニメ・イラスト風】
アニメ・イラスト風モデルは**「鮮やかな輪郭・彩色」**が特徴で、画像生成AIの中でも特に開発が盛んな領域になっています。
以下のようなモデルが特に人気です。
モデル名 | ベース | 特徴 | リンク・備考 |
---|---|---|---|
Waifu Diffusion | SD1.4 | イラスト投稿サイトのデータで追加学習。アニメ塗り再現 | 初期からあるアニメ特化モデル |
Anything | SD1.5 / SDXLベース | Danbooruタグ対応で詳細指定◎。V5ではSDXLを統合 | 幅広いアニメ美術表現に対応 |
Counterfeit | SD1.5 | 鮮やかな色彩やディテール重視のスタイル | 派手な背景やメカ描写も得意 |
AbyssOrangeMix | マージモデル | 多数モデルのブレンドにより鮮やかな発色を実現 | アニメ・ファンタジー系に強い |
Kenshi | SD1.5 | キャラクターデザインと衣装の多様化に注力 | アバター系の生成に利用されること多し |
ここからはそれぞれのモデルの特徴を紹介します。
Waifu Diffusion
日本のアニメやラノベの挿絵風のモデルです。アニメ・美少女イラストに特化した細かい線画や塗りのスタイルを持っています。
目が大きく、髪の質感や服のディテールも丁寧で、二次元キャラの表現に優れています。NSFW(成人向け)にも対応可能です。
Anything
「Anything V3」「V4」などのバージョンがあり、Waifu Diffusionをベースにチューニングされた多用途アニメ系モデル。
ファンタジー・SF・現代系の背景まで幅広く生成できます。**肌や目、髪の塗りにツヤ感が強め、かつキャラの表情やポーズの多様性も高いのが特徴で、**自然な構図を得やすいモデルとなっています。
Counterfeit
アニメとリアルの中間的な画風。柔らかく繊細な陰影と線の少ない構成で、ちょっと幻想的な雰囲気が特徴です。
少女系キャラやポートレートに強く、ややデフォルメされた顔立ち。イラスト寄りながらも、彩度や照明効果を調整すれば実写風にも寄せられる万能型。
AbyssOrangeMix
リアル寄りの美少女系に強い人気モデルです。色彩は鮮やかで、瞳や肌の描写が立体的なのが特徴です。
ファンタジー系や近未来的な背景との相性も良いモデルとなっています。
Kenshi
Kenshiは柔らかい塗りと繊細なライティングが特徴のアニメ風特化モデルです。
背景も自然に馴染み、全体として淡く温かみのある世界観を作ることが可能です。学園系や日常シーン、優しい雰囲気の作品に最適なモデルとなっています。
派生モデルのおすすめ【写真・リアル風】
写真・リアル風の画像生成AIは広告素材やコンセプトアート、背景生成など、実写風が求められるシーンで活躍します。
写真風画像を生成したい方におすすめの派生モデルは以下の通りです。
モデル名 | ベース | 特徴 | リンク・備考 |
---|---|---|---|
Realistic Vision | マージ | 肌表現・風景描写がリアル。広告・商品撮影風に | 人物から静物までオールラウンドに対応 |
ChilloutMix | SD1.5 | 特にアジア系ポートレートが高品質 | 肌の質感や照明効果が高精度 |
Analog Diffusion | SD1.5 | フィルムカメラで撮影したようなノスタルジック表現 | レトロ雰囲気を狙いたい場合に◎ |
Deliberate | マージ | 写真とイラストの中間でオールマイティに使える | 作品ごとの繊細なチューニングに強い |
Juggernaut XL | SDXL | SDXLを改良し写真写実性をさらに追求 | 8GB以上のVRAM推奨。高解像度生成が得意 |
ここからは各モデルの特徴を解説していきます。
Realistic Vision
写真のようなリアルな人物描写が得意な派生モデルです。
肌の質感、髪の流れ、ライティングが自然で、ポートレート生成が得意です。ファッションや日常風景とも相性が良く、モデル撮影のような仕上がりになるのが特徴です。
Chillout Mix
ChilloutMixは、アジア系のリアルな人物描写に強みを持つモデルです。肌や表情が柔らかく、自然な美しさが再現されます。
リアルとイラストの中間のような絵柄も得意で、日本人風のポートレートを生成したい方におすすめです。
Analog Diffusion
Analog Diffusionは、レトロなフィルムカメラ風の写真を再現できるモデルです。
粒子感のある質感や淡い色調が特徴で、ノスタルジックな雰囲気を表現したいときに最適です。昭和風の作風やアナログ感を求める方にぴったりです。
Deliberate
Deliberateは、リアルとイラストの中間を得意とする汎用性の高いモデルです。
柔らかな陰影や自然な表情が特徴で、ポートレートからファンタジー系の背景まで幅広い表現に対応できます。構図が破綻しにくく、初心者にも扱いやすい点も魅力です。
Juggernaut XL
高解像度かつリアリティ重視で設計されたモデルです。
顔の立体感や目の輝き、肌のディテールが非常に高精細で、商用レベルのクオリティを求める方に向いています。Stable Diffusion XLをベースにしており、構図の自由度も高いのが特長です。
派生モデルのおすすめ【その他】
消化した他にも様々なジャンルの派生モデルが存在しています。
以下の表に、その他のおすすめモデル情報をまとめました。
モデル名 | ベースモデル | 特徴 |
---|---|---|
Arcane Diffusion | Stable Diffusion 1.5 | アニメ『Arcane』の独特なビジュアルスタイルを再現。キャラクターの表情や背景の雰囲気を忠実に再現できます。 |
Ghibli Diffusion | Stable Diffusion 1.5 | スタジオジブリ作品のような柔らかく温かみのあるアニメーションスタイルを再現。幻想的な風景や優しい雰囲気が特徴です。 |
NovelAIカスタムモデル | 独自モデル | 小説や物語の挿絵に適した高品質なイラストを生成。多彩なスタイルやテーマに対応し、物語のビジュアル化に活用できます。 |
Pony Diffusion | Stable Diffusion XL | 『マイリトルポニー』のキャラクターやスタイルに特化。カートゥーン風の明るい色彩とシンプルなデザインを再現します。 |
ANIMAGINE XL | Stable Diffusion XL | 高品質なアニメ調画像を生成する最新モデル。プロンプト理解度が高く、多彩なシーンやキャラクターを表現可能です。 |
以下に、各モデルのイメージと特徴を紹介します。
Arcane Diffusion
アニメ『Arcane』の独特なビジュアルスタイルを再現するモデルです。キャラクターの表情や背景の雰囲気など、作品特有のアートスタイルを忠実に再現できます。『Arcane』の世界観を取り入れたイラストやファンアートを作成したい場合に適しています。
Ghibli Diffusion
スタジオジブリ作品のような温かみのあるアニメーションスタイルを再現するモデルです。柔らかな色使いや幻想的な風景、優しい雰囲気のキャラクター描写が特徴で、ジブリ風のイラストやファンタジックなシーンの作成に適しています。
NovelAIカスタムモデル
小説や物語の挿絵に適した高品質なイラストを生成するモデルです。多彩なスタイルやテーマに対応し、ファンタジーから現代劇まで幅広いシーンを描写できます。物語のビジュアル化やオリジナルキャラクターのデザインに活用できます。
Pony Diffusion
『マイリトルポニー』のキャラクターやスタイルに特化したモデルです。カートゥーン風の明るい色彩とシンプルなデザインが特徴で、ポニーキャラクターのイラストやファンアートの作成に適しています。アニメ調の画像生成にも高い性能を発揮します。
ANIMAGINE XL
高品質なアニメ調画像を生成する最新のモデルです。プロンプトの理解度が高く、多彩なシーンやキャラクターを表現できます。手の描写や細部のディテールも向上しており、アニメ風のイラスト制作において高いクオリティを実現します。
Stable Diffusionのモデルを使う方法
ここでは、Stable Diffusionのモデルを実際に使う方法を、複数ステップに分けて解説します。
モデルのダウンロード方法
手順1:モデルの選択
まず、使用したいモデルを選択します。Stable Diffusionの公式モデルや、コミュニティが作成した派生モデルは、以下のサイトで入手できます:
- Hugging Face: 多様なモデルが公開されており、詳細な情報も得られます
- Civitai: ユーザーが生成したモデルや、そのサンプル画像が豊富です
手順2:モデルファイルのダウンロード
選択したモデルのページに移動し、「Download」ボタンをクリックしてモデルファイル(通常は.ckpt形式)をダウンロードします。
モデルの導入方法
モデルをダウンロードしたら、モデルファイルの格納・読み込みの2ステップでモデルを導入します。
手順1:モデルファイルの配置
- モデルフォルダの確認: Stable Diffusionをインストールしたディレクトリ内に「models」フォルダがあります。その中の「Stable-diffusion」フォルダがモデルを格納する場所です。
- モデルファイルの配置: ダウンロードしたモデルファイルを「Stable-diffusion」フォルダ内に移動またはコピーします。
手順2:モデルの読み込み
Stable Diffusion Web UIを起動すると、上記の手順で配置したモデルが自動的に読み込まれます。Web UIの左上にある「Checkpoint」のドロップダウンメニューから、使用したいモデルを選択できます。
Stable Diffusionの公式・派生モデルは商用利用可能?
Stable Diffusionの商用利用については、モデルの種類によって異なります。
ここからは公式モデル、派生モデルそれぞれについて、商用利用可否と利用時の注意点を解説します。
公式モデルは基本的に商用利用可能
Stable Diffusionの公式モデル自体はCreativeML OpenRAIL++ライセンスのもとで提供されており、このライセンスでは、ユーザーが生成した画像に対する権利を主張せず、商用利用も許可されています。そのため、公式モデルに関しては一般的な商用利用が可能です。
ただし、違法なコンテンツの生成や有害な使用は禁止されています。
派生モデルについてはモデルごとのライセンス確認が必要
ユーザーやコミュニティによって作成されたStable Diffusionの派生モデルについては、オリジナルのStable Diffusionとは異なるライセンスが適用されている場合があります。
商用利用を検討する際は、例えばHugging FaceやCivitaiなどのプラットフォーム上で、モデルページのライセンス情報を把握する必要があります。
最新のリリース情報(25/4/1時点)
Stable Diffusionとそのエコシステムは日々進化を遂げており、利用時には常に最新情報を把握しておくことが重要です。
2025年3月末時点での最新ニュースとその影響を解説します。
(25/3/18)「Stable Virtual Camera」の研究プレビュー版公開
Stability AIは、2D画像を没入型の3D動画に変換するマルチビュー拡散モデル「Stable Virtual Camera」の研究プレビュー版を公開しました。
ユーザーはより多様なメディア形式での表現が可能となり、コンテンツ制作の幅が広が流可能性があります。
(25/3/19)ロバート・レガト氏のチーフパイプラインアーキテクト就任
Stability AI社は、『アバター』や『タイタニック』などの映画で知られ、数々のアカデミー賞を受賞しているロバート・レガト氏をチーフパイプラインアーキテクトとして迎えることを発表しました。
同氏はStability AIの技術とVFX業界のニーズを結びつけ、プロダクションパイプラインの革新を目指すと述べています。
レガト氏の参加により、Stable Diffusionの技術がプロフェッショナルな映像制作の現場により適合し、商業利用の幅が広がると期待されます。
まとめ
Stable Diffusionは、公式モデルだけでも1系~3系、SDXLなど多岐にわたり、さらにコミュニティで生まれた数百以上の派生モデルが存在します。目的やスタイルに合ったモデルを見つけることで、より想定に近いクオリティの画像生成が可能です。
実際に試行錯誤しながらプロンプトを調整し、最適なモデルを見つけてみてください。最新モデル情報はCivitaiやHugging Faceの公式リポジトリ、コミュニティDiscord、SNSなどをチェックするのがおすすめです。
Stable Diffusionの進化は日進月歩。ぜひ常にアップデートを追いかけながら、クリエイティブなAI生成を楽しんでください。
AIサービス導入のご相談は AI導入.com へ(無料)
AI導入.comでは、マッキンゼー・アンド・カンパニーで生成AIプロジェクトに従事した代表を中心に、日本・アメリカの最先端のAIサービスの知見を集めています。AIサービスの導入に関するご相談やお問い合わせを無料で承っております。ビジネスの競争力を高めるために、ぜひ以下のお問い合わせフォームよりご連絡ください。