
初心者向けです。ご了承ください。 AUTOMATIC1111版 SDWUを使っていきます。 一般的な高解像度化 高解像度のAIイラストを作成する手法はいくつかあると思いますが、「低解像度で元絵を生成→Real-ESRGANやSwinIRで高解像度化」というステップが割と一般的な手法かと思います。 ↑before ↓after(SwinIRで2倍アップスケール)...
1. img2imgタブで元絵生成時と同じプロンプトを入力
2. img2imgタブに元絵を放り込み、[Crop and resize]モードにし、解像度が最大かつ元絵と大体同じ比率になるようにWidthとHeightを調整
3. Stepは30程度、Denosing strengthは0.3程度辺りで調整。[Restore faces]はオンにした方が良い(場合による)。
前回このような高解像度化に関する記事を書きました。この手法のメリットとデメリットをまとめます↓
メリット:工程が少なく、全体的に細部が新たに描き直され解像度が上がる
デメリット:若干のガチャ要素あり。アス比若干変わる。VRAMをかなり食う。
前回触れなかった(実はよく知らなかった...)SD upscaleというScript機能を使ってみます。
アップデートされて倍率を指定出来るようになり(アップデート前は2倍のみ)、こちらで高解像度化するメリットはかなりありそう。
SD upsclaeの仕組みですが、
[画像をいくつかに分割→分割した画像をそれぞれを高解像度化→ノイズをかけて再生成→分割した画像を繋ぎ合わせる]
という感じらしいです(正確な順番は分かりません)。
このおかげでアス比を変えず、VRAMの消費も抑えられます。めちゃくちゃ良さそうですね...。
デメリットとしては、[分割した画像に対して一つ一つ処理していくので時間がかかる]ということと、[分割された画像のつなぎ目が不自然になる可能性]が想定できます。
では早速実験してみましょう!
Prompt: ((realistic)), (solo shot), nude girl, black medium hair, bangs, sitting, ((spreading legs)), ((slim waist)), japanese actress, 18years old, (((huge breasts))), pubic hair, plump lips, (round face), (puffy nipples), front shot, intricate, highly detailed, dramatic light, sharp shadow, lokking at viewer, (broken blur background), ((outdoor)), full-body
Negative prompt: penis, dick, (fierce look), ((doll)), ((bad fingers)), ((distorted face)), ((androgynous)), ((multipul frames)), ((black and white)), grayscale, ((monochlome)), ((((low quality)))), ((((lowres)))), low polygon 3D game, ((monochrome)), rough graffiti, low quality lowres very ugly fat obesity scar, chibi,(((bad anatomy))), low quality lowres graffiti unbecoming colorfully, incoherent background, long body
Steps: 35, Sampler: DDIM, CFG scale: 11, Seed: 499681589, Face restoration: GFPGAN, Size: 448x640, Model hash: 1876f9b1, Clip skip: 2, ENSD: 31337
モデルはこちらを使用しています↓
これをSwinIRで高解像度化(1408 x 2048)すると...
とりあえず顔だけですがこんな感じ。時間わずか11秒。
では伝家の宝刀、i2iだけで高解像度化してみると...
3分7秒で出来ました(1408x2048)。時間はかかりますがやはり綺麗です。
SD upscaleの性能やいかに...最初からこれでやっていればよかったんではないのか...なんで知らなかったんや...という想いがよぎりますが...とりあえずやってみましょう。
設定は特に変えずこれで走らせてみます。PromptやDenoise Storengthの値も影響しますので要注意です。縦方向2048pixelsになるように3.2倍にしました。
(余談ですがUpscalerは4x-AnimeSharpが個人的に好きです。荒いですが色味が変わりにくいのが良いですね。デフォルトで入っていないUpscalerの入れ方はこちらのGigazineさんの記事をどうぞ→ https://gigazine.net/news/20220922-automatic1111-stable-diffusion-webui-extras/ )
↓
↓
↓
おお!めちゃくちゃいいですね!ただやはり時間が...6分17秒かかってしまいました。この差はでかい...。ガチャ要素は大差無い感じです。
もう一点気になっていたつなぎ目問題ですが、特に気になりませんでした。
試しにTile overlapを64から0にしてみると...
左端にうっすら縦線が見えますね。というかこんなところで分割していたのか...。VRAMの容量から最適なサイズで分割をしているのではないかなと思います。
やはり時間の面でi2iのみのアップスケールがいいですね。
VRAMが少ない場合や、これより更に大きな画像にしたい場合はSD upscaleを使うのが良さそうです。
次回はPromptの違いでクオリティに差が出るのか試してみたいですが...書くかどうかは分かりません...。
※メール等でStableDiffusionの使用方法や、ファイル結合時の7-Zipの使い方について説明する事は出来ません。ご了承ください。
※ダウンロード及びインストールに際して発生する障害やトラブルについて、当方は損害賠償や問題解決の責任を一切負いません。