Stable Diffusionにおける基本的なプロットの書き方、設定の紹介をしていこうと思います。
高画質・高詳細になるやり方の紹介をしたいと思います。
Stable Diffusion、および画像作成する方にとっては(高画質・高詳細)は必須といっても過言ではないくらい、
皆さんがほとんどの人がやっていて、なおかつあまり公開をしない要素の一つではないかと思っています。
(すべての画像に共通する根幹たるプロンプトなので)
なので、今回はその部分をいくつかの例を挙げながらプロンプトの(高画質・高詳細)について検証していきたいと思います。
個人的に大事にしているプロンプトの考え方
まず、その前に基本的なおさらいになりますが、
Stable Diffusionを起動してpromptのところに書きたいものを記入します。
注目してほしいのは、右上に0/75とあることです。
これは、promptについては、75以内を推奨しているのがわかります。
多くの文字を書くことを推奨としていないのも特徴です。
自分はこの考えを重要としていて、なるべく少ない文字で表現するのが大切だと思っています。
特にpromptのほうは、negativepromptのほうは、まだ多くてもいいと持っているのが今の持論です。
そんなところを踏まえて、やっていこうと思います。
ネットに投稿されているプロンプトを参考にして、自分が使っているプロンプトを例にして、比較してみました。
比較してみました
例:prompt NO.1
(masterpiece),(best quality),(shiny skin),(photorealistic:1.4),ultra high res,extremely detailed face, thighhighs, insanely photorealistic,ultra realistic 8k cg, masterpiece, ((ultra detailed background, delicate pattern, intricate detail)), ray traced reflections,
例:prompt NO.2
best quality,masterpiece,highres,beautiful eyes,detailed background
例:prompt NO.3
(8k, RAW photo, ultra high res, best quality, masterpiece:1.2), (realistic illustration), (extremely detailed CG unity 8k wallpaper),
例:prompt NO.4
(8k, RAW photo, best quality, masterpiece:1.2),an extremely delicate and beautiful,
例:prompt NO.5
(8k, masterpiece, best quality, raw photo)
今回は、ネガティブプロンプトは、無し(無記名)で行いました。
結果について
比べてみると、良し悪し難しいと思います。
しかし言えることが、上で書いたように長ければよいとは限らない。短くてもそれなりのクオリティが出る。逆を言うと、さほど差がないということでもあります。
なので、高画質・高詳細するために、長いプロンプトにする必要がないというのが今の考えです。
また上に書いたように、長いと1単語当たりのその成分が薄くなってしまうので、何を書きたいかをはっきりとAIに伝える要素が欠けてしまいます。
はっきりとしたもの、狙って書きたい場合は、余計に高画質・高詳細成分よりも、他のプロンプトに力を入れたほうが良いのではないかと思います。
ただ、また皆さん承知のようにAIが、ランダム的な要素を持ちながら書いているため、ガチャ要素が凄く多いのも特徴です。
それゆえに、今回4枚ずつ画像を掲示しましたが、判定できないところもありますのでご注意ください。
また別の回では、ネガティブプロンプトについてやっていきたいと思います。
(masterpiece),(best quality),(shiny skin),(photorealistic:1.4),ultra high res,extremely detailed face, thighhighs, insanely photorealistic,ultra realistic 8k cg, masterpiece, ((ultra detailed background, delicate pattern, intricate detail)), ray traced reflections,