全体的な流れはLoRA Training Guideを参照しました。
ただし、CUIよりもGUI版の方が楽に扱えるため、こちらを使用しています。
私の環境は必要なものが既に入っていたのか、Installation通りに実行することで環境構築がスムーズに完了しました。
ガイドをよく読まないで実行したため、ディレクトリ構造が原因で失敗し続けました。
[Concept folders follow this format: _]
が重要で、ディレクトリ名で学習回数を制御していました。
ディレクトリ構造が正しければ、GUIで各種ディレクトリを指定、
その他パラメータはとりあえずデフォルトにしてTrain model。
完成したデータを元に画像生成し、ある程度変化が出ていれば成功です!
デフォルトパラメータだと学習元データに寄りすぎたり、クオリティが低かったりと散々なのでパラメータ調整を行います。
ただし作法がさっぱり判らないので...
配布されているLoraファイルの中から好みのLoRAのパラメータを真似るようにしました。
WebuiのAdditional Networkから確認できます。
個人的に効果があったのが、
- epochs数は1、代わりに学習回数(上記ディレクトリ名の)を増加させる
- 最終的にtrain_imagesが3000~4000となるようにする?(4000以上はまだ試していません...)
- Network Dimensionは128
効果はわからないのですが、とりあえずやっていることとしては
- 正規化画像はすべて透明
- 学習画像はTaggerで適当にタグ付け
- Learning rate : 0.0001
- LR Scheduler : cosine_with_restarts
- Clip skip : 1 or 2? 2で作成しましたが、良いデータは1になっています。
- 学習元画像自体をinpaintで修正し再学習 →パンツ造形のクオリティを上げる
- AIで作成した画像のうち、理想形の画像自体を学習元に使用する。
- 3Dデータやフィギュア画像から作成できないか試す