実写系画像の考察【日本人 女性】

はじめに

stable diffusion 実写系の比較をしてみたい。

roopやReactorなどで、実写系の高画質化ができればいいかなと思う。

画像比較

プロンプト:

1girl, 20yo, japanese, stunning face, pretty, cute, looking at viewer, grin, 
(face close up:1.4), 
shiny skin, photo realistic, best quality, 8k, best quality, absurdres, 

ネガティブ:

(Worst Quality:2.0), low quality, low resolution, bad anatomy,  bad hands,bad legs, 

Stable Diffusion checkpoint : Sampling method

BraV7とYayoi、EvoV2とMinazukiは、似たような画像を生成しているように見える

Sampling method は、DDIMとDDM++2M Karras がいいように感じる。

MinazukiとYayoi、DDIMとDDM++2M Karrasを後ほど比較したい。

今回は、YayoiとDDM++2M Karrasを固定して、高画質の実写系を検討してみる

ADetailer

ADetailer なし:あり

ADetailerを活用すると、顔の輪郭が深くなるイメージになる。

mediapipe_face_full : 実写系の顔

Hires.fix

Upscaler:R-ESRGAN 4X+ Denoising strength:0.5

Upscale by:1 1.2 1.5 2

Upscaleを施すと顔が崩れてくると思っていたが、2倍にしても崩れなかった。

Upscaleを拡大したほうが、当たり前だが高画質になる

Hires Steps

Hires Steps を比較してみる

Hires Steps を変えても違いがわからなかった

Hires Stepsを0に固定する

プロンプト比較

プロンプト:pretty,Beautiful,Lovely,Cute,Angelic,Charming,Dazzling,Graceful

試しに、全部のプロンプトを入れて生成してみた

BraV7 EvoV2 Minazuki Yayoi と DDIMとDDM++2M Karras 比較表

  • ADetailer あり mediapipe_face_full : 実写系の顔
  • Hires Stepsを0に固定