Trained for 1 epochs and 36500 steps.

Trained with datasets ['text-embeds-pixart-filter', 'photo-concept-bucket', 'moviecollection', 'experimental', 'ethnic', 'sports', 'architecture', 'shutterstock', 'cinemamix-1mp', 'nsfw-1024', 'anatomy', 'bg20k-1024', 'yoga', 'photo-aesthetics', 'text-1mp', 'movieposters', 'normalnudes', 'pixel-art', 'signs', 'midjourney-v6-520k-raw', 'sfwbooru', 'nijijourney-v6-520k-raw', 'dalle3']
Learning rate 1e-06, batch size 24, and 1 gradient accumulation steps.
Used DDPM noise scheduler for training with epsilon prediction type and rescaled_betas_zero_snr=False
Using 'linspace' timestep spacing.
Base model: ptx0/pixart-900m-1024-ft-large
VAE: madebyollin/sdxl-vae-fp16-fix

Files changed (12) hide show

README.md +4 -4
optimizer.bin +1 -1
random_states_0.pkl +1 -1
scheduler.bin +1 -1
training_state-dalle3.json +2 -2
training_state-midjourney-v6-520k-raw.json +2 -2
training_state-nijijourney-v6-520k-raw.json +2 -2
training_state-photo-concept-bucket.json +2 -2
training_state-sfwbooru.json +0 -0
training_state-text-1mp.json +0 -0
training_state.json +1 -1
transformer/diffusion_pytorch_model.safetensors +1 -1

README.md CHANGED Viewed

@@ -62,7 +62,7 @@ You may reuse the base model text encoder for inference.
 ## Training settings
 - Training epochs: 1
-- Training steps: 35500
 - Learning rate: 1e-06
 - Effective batch size: 192
   - Micro-batch size: 24
@@ -80,7 +80,7 @@ You may reuse the base model text encoder for inference.
 ### photo-concept-bucket
 - Repeats: 0
 - Total number of images: ~564672
-- Total number of aspect buckets: 3
 - Resolution: 1.0 megapixels
 - Cropped: False
 - Crop style: None
@@ -232,7 +232,7 @@ You may reuse the base model text encoder for inference.
 ### sfwbooru
 - Repeats: 0
 - Total number of images: ~271488
-- Total number of aspect buckets: 6
 - Resolution: 1.0 megapixels
 - Cropped: False
 - Crop style: None
@@ -240,7 +240,7 @@ You may reuse the base model text encoder for inference.
 ### nijijourney-v6-520k-raw
 - Repeats: 0
 - Total number of images: ~516288
-- Total number of aspect buckets: 3
 - Resolution: 1.0 megapixels
 - Cropped: False
 - Crop style: None

 ## Training settings
 - Training epochs: 1
+- Training steps: 36500
 - Learning rate: 1e-06
 - Effective batch size: 192
   - Micro-batch size: 24
 ### photo-concept-bucket
 - Repeats: 0
 - Total number of images: ~564672
+- Total number of aspect buckets: 2
 - Resolution: 1.0 megapixels
 - Cropped: False
 - Crop style: None
 ### sfwbooru
 - Repeats: 0
 - Total number of images: ~271488
+- Total number of aspect buckets: 3
 - Resolution: 1.0 megapixels
 - Cropped: False
 - Crop style: None
 ### nijijourney-v6-520k-raw
 - Repeats: 0
 - Total number of images: ~516288
+- Total number of aspect buckets: 2
 - Resolution: 1.0 megapixels
 - Cropped: False
 - Crop style: None

optimizer.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:aa1a7136c92558908a1c2b81c1c68bf828a8ca0984bd5c6ee745652a48f25eff
 size 5451415117

 version https://git-lfs.github.com/spec/v1
+oid sha256:99ee1a96defb643fbdbea455632d6dd94ddac3d515e6afa1af88ef3ceb8a1883
 size 5451415117

random_states_0.pkl CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:658413fe745cd97a7b1fd9d7676b34d9251f476c9326705bda6bfeba53ca5ebc
 size 16100

 version https://git-lfs.github.com/spec/v1
+oid sha256:482be5e19b31f172160e8aeaac61f213e702ed27bf177415f6b4694c3417acd7
 size 16100

scheduler.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5cf3fffa2c56666db1a062e04ba11466ec4b818ef4244dc94590d18c86c95e55
 size 1000

 version https://git-lfs.github.com/spec/v1
+oid sha256:c661fcdee20037d519c92c9fff453c9c50b8eab6819bee6a140b94fd0509d116
 size 1000

training_state-dalle3.json CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:99b6f5d28783c45361aa0cd9dd799ae63369803d932f075f9e321bdca3c4e83f
-size 10606242

 version https://git-lfs.github.com/spec/v1
+oid sha256:2a6baa90e15b6f9f058268bb05dd6c6be281f0b72f62fce993397f3946e4351a
+size 10883736

training_state-midjourney-v6-520k-raw.json CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b24917d8eb7f09275a9135b43c2c9b4ed0e1e9c45baf9b9ff8d4b572d4af921c
-size 8927895

 version https://git-lfs.github.com/spec/v1
+oid sha256:e6eeaeaa33404c9f95e760abb3743277f48d280420a32a4b26429c3321615cad
+size 9365439

training_state-nijijourney-v6-520k-raw.json CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9a3d2685e7aaf3a1bfbfa316205786cc9b40b9539d3ee7690a33be0cc4f554e7
-size 9421411

 version https://git-lfs.github.com/spec/v1
+oid sha256:73bd1aa3e8f6dbf8b58a255591bd2473c465f491b5e929d0d4671eada02ca14e
+size 9857011

training_state-photo-concept-bucket.json CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:944d863ab1881c90e32bd86c614b2a504a05bbdefd5d88274b2213aed937442f
-size 7240538

 version https://git-lfs.github.com/spec/v1
+oid sha256:3502bff8d4d03ccd4cd9b4a94bc66539c598f544101ee047a08061b54affa9f3
+size 7534642

training_state-sfwbooru.json CHANGED Viewed

The diff for this file is too large to render. See raw diff

training_state-text-1mp.json CHANGED Viewed

The diff for this file is too large to render. See raw diff

training_state.json CHANGED Viewed

@@ -1 +1 @@

- {"global_step": ~~35500~~, "epoch_step": 1, "epoch": 2, "exhausted_backends": ["pixel-art", "signs", "sports", "ethnic", "experimental", "movieposters", "normalnudes", "yoga", "cinemamix-1mp", "architecture", "moviecollection", "shutterstock", "nsfw-1024", "photo-aesthetics", "bg20k-1024", "anatomy"], "repeats": {"bookcovers": 0, "signs": 0, "normalnudes": 0, "nijijourney": 0, "movieposters": 0, "celebrities": 0, "pixel-art": 0, "propagandaposters": 0, "sports": 0, "moviecollection": 0, "gay": 0, "experimental": 0, "yoga": 0, "ethnic": 0, "cinemamix-1mp": 0, "architecture": 0, "mj-60": 0, "text-1mp": 14, "shutterstock": 0, "nsfw-1024": 0, "photo-aesthetics": 0, "anatomy": 0, "bg20k-1024": 0, "sfwbooru": 0, "midjourney-v6-520k-raw": 0, "nijijourney-v6-520k-raw": 0, "photo-concept-bucket": 0, "dalle3": 0}}

+ {"global_step": 36500, "epoch_step": 1, "epoch": 2, "exhausted_backends": ["pixel-art", "signs", "sports", "ethnic", "experimental", "movieposters", "normalnudes", "yoga", "cinemamix-1mp", "architecture", "moviecollection", "shutterstock", "nsfw-1024", "photo-aesthetics", "bg20k-1024", "anatomy"], "repeats": {"bookcovers": 0, "signs": 0, "normalnudes": 0, "nijijourney": 0, "movieposters": 0, "celebrities": 0, "pixel-art": 0, "propagandaposters": 0, "sports": 0, "moviecollection": 0, "gay": 0, "experimental": 0, "yoga": 0, "ethnic": 0, "cinemamix-1mp": 0, "architecture": 0, "mj-60": 0, "text-1mp": 16, "shutterstock": 0, "nsfw-1024": 0, "photo-aesthetics": 0, "anatomy": 0, "bg20k-1024": 0, "sfwbooru": 0, "midjourney-v6-520k-raw": 0, "nijijourney-v6-520k-raw": 0, "photo-concept-bucket": 0, "dalle3": 0}}

transformer/diffusion_pytorch_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:66e6cd23cc38bac6623be10f5e81913b235721416fc0ee35a283fed1f99aad44
 size 1816969728

 version https://git-lfs.github.com/spec/v1
+oid sha256:570bd5ce1e1bf8c8f65f1466f5513d1e30b35a754f711a9eddc613ff7861e83e
 size 1816969728