Update README.md
Browse files
README.md
CHANGED
@@ -23,13 +23,55 @@ license: creativeml-openrail-m
|
|
23 |
- 学習時間:408時間(約17日間)
|
24 |
|
25 |
- 全学習共通
|
|
|
26 |
バッチサイズ:2
|
|
|
27 |
学習解像度1024
|
28 |
|
29 |
- 学習第一段階
|
30 |
-
-
|
31 |
-
|
32 |
-
|
33 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
34 |
|
35 |
-
|
|
|
|
23 |
- 学習時間:408時間(約17日間)
|
24 |
|
25 |
- 全学習共通
|
26 |
+
|
27 |
バッチサイズ:2
|
28 |
+
|
29 |
学習解像度1024
|
30 |
|
31 |
- 学習第一段階
|
32 |
+
ベースIP-adapterモデル:ip-adapter_sdxl.bin(https://huggingface.co/h94/IP-Adapter)
|
33 |
+
|
34 |
+
ベースcheckpoint:animagineXL3.1
|
35 |
+
|
36 |
+
トレーニング枚数:5万枚
|
37 |
+
|
38 |
+
学習率:1e-4(一定)
|
39 |
+
|
40 |
+
学習ステップ:40万ステップ
|
41 |
+
|
42 |
+
- 学習第二段階
|
43 |
+
|
44 |
+
ベースIP-adapterモデル:ip-adapter_animegineXL-400000.bin(非公開)
|
45 |
+
|
46 |
+
ベースモデル:NoobAI 1.1
|
47 |
+
|
48 |
+
トレーニング枚数:5万枚(途中から反転画像を加え10万枚に)
|
49 |
+
|
50 |
+
学習率:1e-7(一定)
|
51 |
+
|
52 |
+
学習ステップ:40万ステップ
|
53 |
+
|
54 |
+
|
55 |
+
- 学習第二段階
|
56 |
+
|
57 |
+
ベースIP-adapterモデル:ip-adapter_noobAI_XL-400000.bin(非公開)
|
58 |
+
|
59 |
+
ベースモデル:NoobAI 1.1
|
60 |
+
|
61 |
+
トレーニング枚数:10万枚(一部に前回のデータセットを含む・反転画像なし)
|
62 |
+
|
63 |
+
学習率:6e-5(1%ウォームアップ付きコサイン曲線・終端1.2e-5)
|
64 |
+
|
65 |
+
学習ステップ:40万ステップ
|
66 |
+
|
67 |
+
- 備考
|
68 |
+
SDXL_baseで学習されたIP-adapterモデルはanimagineXL3.1では1e-4という比較的高い学習率でも発散することなく学習できた。
|
69 |
+
|
70 |
+
しかし、学習第二段階でNoobAIをもとに学習すると高い学習率では早々に発散が発生した。
|
71 |
+
|
72 |
+
そこで、一度低い学習率でトレーニングを行い徐々にNoobAIに適応するよう学習を行った。
|
73 |
+
|
74 |
+
学習第三段階でよりNoobAIにフィットするよう学習率を上げた。コサイン曲線を導入したが必要性は薄いと思われる。
|
75 |
|
76 |
+
- 謝辞
|
77 |
+
最後にこの学習に多くのアドバイスをくださった天紗愛(https://x.com/Ai_tensa)氏にこの場を借りてお礼申し上げます。
|