kataragi commited on
Commit
4c789fb
·
verified ·
1 Parent(s): e3bdd1a

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +47 -5
README.md CHANGED
@@ -23,13 +23,55 @@ license: creativeml-openrail-m
23
  - 学習時間:408時間(約17日間)
24
 
25
  - 全学習共通
 
26
  バッチサイズ:2
 
27
  学習解像度1024
28
 
29
  - 学習第一段階
30
- - ベースモデル:animagineXL3.1
31
- - トレーニング枚数:5万枚
32
- - 学習率:1e-4(一定)
33
- - 学習ステップ:40万ステップ
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
34
 
35
-
 
 
23
  - 学習時間:408時間(約17日間)
24
 
25
  - 全学習共通
26
+
27
  バッチサイズ:2
28
+
29
  学習解像度1024
30
 
31
  - 学習第一段階
32
+ ベースIP-adapterモデル:ip-adapter_sdxl.bin(https://huggingface.co/h94/IP-Adapter)
33
+
34
+ ベースcheckpoint:animagineXL3.1
35
+
36
+ トレーニング枚数:5万枚
37
+
38
+ 学習率:1e-4(一定)
39
+
40
+ 学習ステップ:40万ステップ
41
+
42
+ - 学習第二段階
43
+
44
+ ベースIP-adapterモデル:ip-adapter_animegineXL-400000.bin(非公開)
45
+
46
+ ベースモデル:NoobAI 1.1
47
+
48
+ トレーニング枚数:5万枚(途中から反転画像を加え10万枚に)
49
+
50
+ 学習率:1e-7(一定)
51
+
52
+ 学習ステップ:40万ステップ
53
+
54
+
55
+ - 学習第二段階
56
+
57
+ ベースIP-adapterモデル:ip-adapter_noobAI_XL-400000.bin(非公開)
58
+
59
+ ベースモデル:NoobAI 1.1
60
+
61
+ トレーニング枚数:10万枚(一部に前回のデータセットを含む・反転画像なし)
62
+
63
+ 学習率:6e-5(1%ウォームアップ付きコサイン曲線・終端1.2e-5)
64
+
65
+ 学習ステップ:40万ステップ
66
+
67
+ - 備考
68
+ SDXL_baseで学習されたIP-adapterモデルはanimagineXL3.1では1e-4という比較的高い学習率でも発散することなく学習できた。
69
+
70
+ しかし、学習第二段階でNoobAIをもとに学習すると高い学習率では早々に発散が発生した。
71
+
72
+ そこで、一度低い学習率でトレーニングを行い徐々にNoobAIに適応するよう学習を行った。
73
+
74
+ 学習第三段階でよりNoobAIにフィットするよう学習率を上げた。コサイン曲線を導入したが必要性は薄いと思われる。
75
 
76
+ - 謝辞
77
+ 最後にこの学習に多くのアドバイスをくださった天紗愛(https://x.com/Ai_tensa)氏にこの場を借りてお礼申し上げます。