・どんな法則があるの?
・初心者に向けてわかりやすく教えて!
ぜひ初心者の方は最後まで読んでいただけると良いと思います。
プロンプトの基本的な4つの法則
stablediffusionの基本的な4つの法則を紹介します。
- 優先度の高い要素を前に配置する
- トークン数の制限を意識する
- 括弧や重みづけの使用
- モデルの特性に合わせる
優先度の高い要素を前に配置する
Stable Diffusionは、入力された呪文の順序に応じて優先度が変わり、それによって絵柄が変化するアルゴリズムです。
つまり、呪文の順番を変えるだけで、生成される絵画や出力が異なる特性を持つことが特徴です。
一般的なプロンプトの順番は
1.イラスト全体に影響を与える要素
2. 人物
3. 髪型や服装、アクセサリーなど
4. 構図(ポーズなど)
Stable Diffusionにおいて、呪文の順序は重要ですが、あまり意識しなくても機能します。
重要な部分や望む結果が得られない場合、順序を工夫して調整することができます。
トークン数の制限を意識する
トークンは75トークンを意識しましょう
stablediffusionは「トークン」という単位でカウントされています。
masterpiece, ultrahighres
このようなプロンプトでは、「masterpiece」、「,」、「ultrahighres」の3トークンがカウントされています。
Stable Diffusionの特性として、英単語、数字だけでなく、「,」(カンマ)もトークンとして数えられます。
75トークンを1つの単位として扱うため、75トークンを超える長い呪文を入力できます、扱いが複雑になることに留意が必要です。
1回目:75トークンまで
2回目:76〜150トークンまで
というまとまりで指示が送られます。
75トークン目にshort hairの「short」があると、
76トークン目に「hair」があるので思うように生成ができません。
初心者の方は、Stable Diffusionを使う際に、トークンの制限を考慮し、できるだけ75トークン以内で入力することをおすすめします。
トークン数を制限するための「BREAK」などの対策法もありますが、これは難しい話題であるため、基本的には75トークン以内に収めることをお勧めします。
括弧や重みづけの使用
特に重要な部分や反映が難しい部分の呪文には、括弧を使って注釈をつけることが大切です。
注釈をつけるには、例えば “(masterpiece:1.1)” のように括弧と数字を使います。
この方法を使えば、通常の倍の強調ができます。
ただし、括弧()を重ねて使うことはお勧めせず、エラーが生じる可能性があるため、避けた方が良いです。
モデルの特性に合わせる
配布先のサイトには「README.md」というファイルがあるのでダウンロードする前に一度目を通すと良いでしょう。
このような感じです。
Hugging Face
呪文のアプローチはモデルによって異なるため、それぞれのモデルのガイドラインを理解し、適切に活用することが勧められます。
【参照用】プロンプトのテンプレ
プロンプト
(8k, RAW photo, best quality, masterpiece), (realistic, photo-realistic:),((18years old:1.4)),
,medium breasts,((slender:1.5)),((blunt bang flipped short hair)),
((deep blue:1.2 shiny metalic competition swimsuit:1.3)),
,tokyo akihabara street,((cowboy shot:1.4)),
「masterpiece」や「best quality」など、イラストの品質に関連するトークンは通常、最初に書かれる傾向があります。
しかし、呪文の順序には厳格な決まりはなく、一般的な順序は「登場人物」→「特徴」→「背景」→「構図」→「光の当て方」のように変えても構いません。
順序を変えることで、生成されるイラストがどのように変化するか試してみるのも面白いアイデアです。
ネガティブプロンプト
ugly face,too much muscle, bad hands, bad arms, bad legs,missing fingers,((age spot)), (bad anatomy):2, (too many legs),(long_body):2(too many fingers), (((long neck))), paintings, sketches, (worst quality:2), (low quality:2), (normal quality:2),,mole,2 peoples,bad leg,
イラストの品質を保つために、「worst quality」や「low quality」などのトークンを常に含めることがおすすめされます。
「depth of field」などはピンボケを防ぐのに役立つトークンで、ボヤっとしたイラストを防ぐ助けになります。エロ系のイラストを避けるためには「nsfw」というトークンを追加することも重要です。
ネガティブプロントを書くのが手間な場合は、「EasyNegative」という拡張機能を使用する方法もあります。
詳細な使い方については別の記事で解説されているので、興味がある場合はそれを参照してみることをお勧めします。
Loraも使用しましょう
複雑なイラストを生成するために、呪文だけでは細かな指定が難しいことがあります。
呪文を細かく設定しようとすると長くなり、各呪文が適切に処理されないことがあります。
このような場合に役立つのがLoRA(追加学習)です。
LoRAはモデルを特定の方向に微調整するために使用され、公開されている多くのLoRAが利用可能です。
自分の好みに合ったLoRAを見つければ、望み通りのイラスト生成に近づけるでしょう。LoRAの導入方法や使い方については、別の記事で詳細に解説されています。
AI絵師のプロンプトを確認する方法
どうやったらこのような感じになるのだろうとお困りの方は一定数います。
そのような方におすすめのサイトを紹介します。
・Civitai
・MaginAI
・our AI
・chichi-pui
以下の記事で詳しく説明をしています。
使用環境にお困りなら…
AIイラスト生成をより快適に行いたい場合、グラフィックボード(グラボ)のアップグレードがおすすめです。グラボはAIイラスト生成において非常に重要な役割を果たし、高性能なCPUやメモリを持っていても、性能の低いグラボでは制約が生じる可能性があります。
本格的にAIイラスト制作に取り組む場合、グラボには適切な投資を検討しましょう。最低でも12GBのVRAMを搭載したグラボが望ましいです。VRAMが2GBや4GB程度しかない古いグラボでは、高解像度の作業や学習に制限が生じる可能性があります。
予算に制約がある場合でも、コストパフォーマンスを重視するならRTX 3060がおすすめです。予算が5万円以下の方にとって、RTX 3060は優れた選択肢と言えます。グラボのアップグレードは、AIイラスト制作の効率と品質向上に大いに貢献するでしょう。
予算に余裕のある方はRTX 4090一択です
予算を増やして、ハイスペックなグラフィックボードに興味がある方には、以下の記事が役立つでしょう!
また、PC全体を新しく購入しようと考えている方にも、以下の記事が参考になります。Stable Diffusionを快適に利用できるおすすめのマシンが紹介されています。ぜひこれらの記事をチェックして、最適なハードウェアを選びましょう。
【Stale Diffusion】基本的な法則4つまとめ
Stable Diffusionで呪文を書く際に考慮すべき4つの法則があります。
これらの法則を意識しながら、呪文の順序や強調度を変えて試してみることが重要です。
これらのポイントを押さえながら、望む結果を得るために実践してみましょう。
最後までお読みいただき、ありがとうございました!!!
