morisato
/

scenery_LoRA_01_karaokeroom

Japanese

LoRA

Model card Files Files and versions Community

morisato commited on Feb 8, 2023

Commit

e66f41d

•

1 Parent(s): 3ed4614

Update README.md

Browse files

Files changed (1) hide show

README.md +11 -11

README.md CHANGED Viewed

@@ -1,7 +1,3 @@
-license: unknown
-language:
-- ja
----
 # 背景LoRA
@@ -17,7 +13,7 @@ Loraを読み込ませて、プロンプトに　**karaokeroom**　と記述し
 プロンプトに、1girl, karaoke, microphone, 等とあわせて記述していただくとカラオケを歌ってる感じの絵ができます。
 ※当LoRAを適用すると人物の描画や画風に影響が生じるようです。LoRAを適用するWeightを調整することで画風への影響を抑えられます。
-影響が気になった場合は <lora:karaokeroom:1>ではなく<lora:karaokeroom:0.6>といった感じで調整して使ってみてください。
 ※karaokeroom, 1girl, karaoke, 等のプロンプトを書いても、部屋の風景のみで人物がうまく描画されないことがあります。
 ガチャ要素があるのと、モデルによってはうまく働かない場合があるようです。その場合は根気よく何枚か生成してみるか、違うモデルを使ってみてください。
@@ -34,7 +30,10 @@ Loraを読み込ませて、プロンプトに　**karaokeroom**　と記述し
 実際に学習を実行して出来上がった当LoRAを読み込ませると上記の karaokeroom というプロンプトでカラオケ店の部屋っぽい絵が生成できます。
 場所の概念を学習させる実験は成功ではないでしょうか？
 ## 問題点、今後の課題
 カラオケ店の風景は再現できるようになりました。が、当LoRAを適用してカラオケを歌う女の子の絵を生成すると、人物の描画や画風に影響が生じる場合があります。
 これはおそらく場所の概念だけではなく、素材写真の画風等も学習してしまったものだと思います。
@@ -42,17 +41,18 @@ Loraを読み込ませて、プロンプトに　**karaokeroom**　と記述し
 ・U-net層でWeight調整することで影響を押さえられる？
 実は僕も全然よく分かってないのですが（！）
-階層マージ(Marge Block Weighted)で多くの方が様々なモデルマージに挑戦した結果、絵を生成するU-netの各レイヤー層を調節することで描画に様々な調節ができる（らしい？）ことがわかってきました。
-例えば「INの上層はリアル調、INの下層がanime調を担当しているのではないか？」、「M_00は全体にキャラクターや服装・背景等に大きな影響が出る」、「OUT上層は、主題以外の表現 (例えば背景)に影響を及ぼしている」、「OUT04,OUT05,OUT06あたりはめっちゃ顔に影響ある」等色々な仮説・検証・推論があります。
 もし、背景に大きく関与しているU-net層が分かれば、それ以外のU-net層への関与を抑えることで、既存モデルの人物描写と追加学習背景LoRAでうまく共存できないだろうか？
-…と考えて、U-net層別にWeightを調節できるScripts（sd-webui-lora-block-weight：https://github.com/hako-mikan/sd-webui-lora-block-weight）を使って色々な数値を調整したXY Plot画像等を作成してみましたが…、現状では「何もわからないことがわかった」「自分が無力だってことだけ」という感じです。
 ・学習時のキャプション（タグ）の付け方などで、画風は学ばないようにできないか？
 ・正則化画像を用意することで何かうまく学習の調整ができるのでは？
-等が考えられると思いますが、まだ試行錯��や情報が足りず良い解決方法は得られていません。

 # 背景LoRA
 プロンプトに、1girl, karaoke, microphone, 等とあわせて記述していただくとカラオケを歌ってる感じの絵ができます。
 ※当LoRAを適用すると人物の描画や画風に影響が生じるようです。LoRAを適用するWeightを調整することで画風への影響を抑えられます。
+影響が気になった場合は \<lora:karaokeroom:1\>ではなく\<lora:karaokeroom:0.6\>といった感じで調整して使ってみてください。
 ※karaokeroom, 1girl, karaoke, 等のプロンプトを書いても、部屋の風景のみで人物がうまく描画されないことがあります。
 ガチャ要素があるのと、モデルによってはうまく働かない場合があるようです。その場合は根気よく何枚か生成してみるか、違うモデルを使ってみてください。
 実際に学習を実行して出来上がった当LoRAを読み込ませると上記の karaokeroom というプロンプトでカラオケ店の部屋っぽい絵が生成できます。
 場所の概念を学習させる実験は成功ではないでしょうか？
+LoRAでうまく場所の概念を学習できる方法が確立できれば日本の様々な風景を学習させることで身近な場所のイラストが生成できるようになると思います。これはその第一歩です。
 ## 問題点、今後の課題
 カラオケ店の風景は再現できるようになりました。が、当LoRAを適用してカラオケを歌う女の子の絵を生成すると、人物の描画や画風に影響が生じる場合があります。
 これはおそらく場所の概念だけではなく、素材写真の画風等も学習してしまったものだと思います。
 ・U-net層でWeight調整することで影響を押さえられる？
 実は僕も全然よく分かってないのですが（！）
+階層マージ(Marge Block Weighted)で多くの方が様々なモデルマージに挑戦した結果、絵を生成するU-netの各レイヤー層を調節することで描画に様々な調整ができる（？）ことがわかってきました。
+例えば「INの上層はリアル調、INの下層がanime調を担当しているのではないか？」、「M_00は全体にキャラクターや服装・背景等に大きな影響が出る」、「OUT上層は、主題以外の表現 (例えば背景)に影響を及ぼしている」、「OUT04,OUT05,OUT06あたりはめっちゃ顔に影響ある」等色々な説があります。
 もし、背景に大きく関与しているU-net層が分かれば、それ以外のU-net層への関与を抑えることで、既存モデルの人物描写と追加学習背景LoRAでうまく共存できないだろうか？
+…と考えて、U-net層別にWeightを調節できるScripts（sd-webui-lora-block-weight：https://github.com/hako-mikan/sd-webui-lora-block-weight ）を使って色々な数値を調整したXY Plot画像等を作成してみましたが…、現状では「何もわからないことがわかった」という感じです。
+・学習用素材の写真をうまく調整する
 ・学習時のキャプション（タグ）の付け方などで、画風は学ばないようにできないか？
 ・正則化画像を用意することで何かうまく学習の調整ができるのでは？
+等、いろいろな案が考えられると思いますが…まだまだ試行錯誤の段階で情報が足りず良い解決方法は得られていません。
+なかなか難しそうですが、うまく場所の概念だけ覚えさせる方法が出来たらいいですよね。