Trained for 1 epochs and 35000 steps.

Trained with datasets ['text-embeds-pixart-filter', 'photo-concept-bucket', 'moviecollection', 'experimental', 'ethnic', 'sports', 'architecture', 'shutterstock', 'cinemamix-1mp', 'nsfw-1024', 'anatomy', 'bg20k-1024', 'yoga', 'photo-aesthetics', 'text-1mp', 'movieposters', 'normalnudes', 'pixel-art', 'signs', 'midjourney-v6-520k-raw', 'sfwbooru', 'nijijourney-v6-520k-raw', 'dalle3']
Learning rate 1e-06, batch size 24, and 1 gradient accumulation steps.
Used DDPM noise scheduler for training with epsilon prediction type and rescaled_betas_zero_snr=False
Using 'linspace' timestep spacing.
Base model: ptx0/pixart-900m-1024-ft-large
VAE: madebyollin/sdxl-vae-fp16-fix

Files changed (13) hide show

README.md +4 -4
optimizer.bin +1 -1
random_states_0.pkl +2 -2
scheduler.bin +1 -1
training_state-anatomy.json +0 -0
training_state-dalle3.json +2 -2
training_state-midjourney-v6-520k-raw.json +2 -2
training_state-nijijourney-v6-520k-raw.json +2 -2
training_state-photo-concept-bucket.json +2 -2
training_state-sfwbooru.json +0 -0
training_state-text-1mp.json +0 -0
training_state.json +1 -1
transformer/diffusion_pytorch_model.safetensors +1 -1

README.md CHANGED Viewed

@@ -62,7 +62,7 @@ You may reuse the base model text encoder for inference.
 ## Training settings
 - Training epochs: 1
-- Training steps: 34500
 - Learning rate: 1e-06
 - Effective batch size: 192
   - Micro-batch size: 24
@@ -152,7 +152,7 @@ You may reuse the base model text encoder for inference.
 ### anatomy
 - Repeats: 5
 - Total number of images: ~15168
-- Total number of aspect buckets: 3
 - Resolution: 1.0 megapixels
 - Cropped: True
 - Crop style: random
@@ -232,7 +232,7 @@ You may reuse the base model text encoder for inference.
 ### sfwbooru
 - Repeats: 0
 - Total number of images: ~271488
-- Total number of aspect buckets: 9
 - Resolution: 1.0 megapixels
 - Cropped: False
 - Crop style: None
@@ -240,7 +240,7 @@ You may reuse the base model text encoder for inference.
 ### nijijourney-v6-520k-raw
 - Repeats: 0
 - Total number of images: ~516288
-- Total number of aspect buckets: 5
 - Resolution: 1.0 megapixels
 - Cropped: False
 - Crop style: None

 ## Training settings
 - Training epochs: 1
+- Training steps: 35000
 - Learning rate: 1e-06
 - Effective batch size: 192
   - Micro-batch size: 24
 ### anatomy
 - Repeats: 5
 - Total number of images: ~15168
+- Total number of aspect buckets: 2
 - Resolution: 1.0 megapixels
 - Cropped: True
 - Crop style: random
 ### sfwbooru
 - Repeats: 0
 - Total number of images: ~271488
+- Total number of aspect buckets: 6
 - Resolution: 1.0 megapixels
 - Cropped: False
 - Crop style: None
 ### nijijourney-v6-520k-raw
 - Repeats: 0
 - Total number of images: ~516288
+- Total number of aspect buckets: 4
 - Resolution: 1.0 megapixels
 - Cropped: False
 - Crop style: None

optimizer.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f687eeaf935cdc59542dbe6055d5b7db2fb0991e320cb4e38e3f8d0eefdea6a2
 size 5451415117

 version https://git-lfs.github.com/spec/v1
+oid sha256:a0c2796621c2849512d6007b139950be8bad2cfada9ca43de8e3227f2d978162
 size 5451415117

random_states_0.pkl CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:14194aa4acad3ed40905837a242ad97bd7ab32d0a012e0d6018ce9ab7a955fd8
-size 16100

 version https://git-lfs.github.com/spec/v1
+oid sha256:c23e7c622a74288766dea07bd66de1073b7fd7a88ba3bdf5d2159e097cf42aff
+size 16036

scheduler.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0034e017275c221ecd11edb6edcd7b25247e38c9ef37110ad0b805bb8be314b7
 size 1000

 version https://git-lfs.github.com/spec/v1
+oid sha256:b9a9723ad329887a64c1a37c3a7336347f4f420b46eb6660585dcca99720703c
 size 1000

training_state-anatomy.json CHANGED Viewed

The diff for this file is too large to render. See raw diff

training_state-dalle3.json CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fa80fc388b49db53b38e0c499ab2b5d5e02fe8d352f1903291c40d40ae4b3ba6
-size 10327184

 version https://git-lfs.github.com/spec/v1
+oid sha256:26c062612bb87480b5ecc18ea348478e1b24d4f6eb983b68460e85d8c90aed66
+size 10465958

training_state-midjourney-v6-520k-raw.json CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:92efb7e8dc9d61ff74585e9ff3b48e74f6f89c41339cb0c141a5ea14cdbb152f
-size 8537319

 version https://git-lfs.github.com/spec/v1
+oid sha256:3ad1e7eaaee901177073068979dc916a7d14792bc184afd8473118478fbf83cd
+size 8737551

training_state-nijijourney-v6-520k-raw.json CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:77c2155c9fd0f0ba4254c77197870fe2f369e2d8476029800cf5c0c81bec1f8c
-size 8985811

 version https://git-lfs.github.com/spec/v1
+oid sha256:347fcf13111e6b75ad1e33d50d8f4bb02b1788137b2135622881941351e062a4
+size 9189091

training_state-photo-concept-bucket.json CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cb90d320fd126021e00c337be91fc4ef4c2c2210728dc004e65cd474f8d3571b
-size 6930713

 version https://git-lfs.github.com/spec/v1
+oid sha256:24176cce40b1acdb6c4e26dca2843807dc487263c54e85acda212c9ace2145c3
+size 7075938

training_state-sfwbooru.json CHANGED Viewed

The diff for this file is too large to render. See raw diff

training_state-text-1mp.json CHANGED Viewed

The diff for this file is too large to render. See raw diff

training_state.json CHANGED Viewed

@@ -1 +1 @@

- {"global_step": ~~34500~~, "epoch_step": 1, "epoch": 2, "exhausted_backends": ["pixel-art", "signs", "sports", "ethnic", "experimental", "movieposters", "normalnudes", "yoga", "cinemamix-1mp", "architecture", "moviecollection", "shutterstock", "nsfw-1024", "photo-aesthetics", "bg20k-1024"], "repeats": {"bookcovers": 0, "signs": 0, "normalnudes": 0, "nijijourney": 0, "movieposters": 0, "celebrities": 0, "pixel-art": 0, "propagandaposters": 0, "sports": 0, "moviecollection": 0, "gay": 0, "experimental": 0, "yoga": 0, "ethnic": 0, "cinemamix-1mp": 0, "architecture": 0, "mj-60": 0, "text-1mp": 12, "shutterstock": 0, "nsfw-1024": 0, "photo-aesthetics": 0, "anatomy": 5, "bg20k-1024": 0, "sfwbooru": 0, "midjourney-v6-520k-raw": 0, "nijijourney-v6-520k-raw": 0, "photo-concept-bucket": 0, "dalle3": 0}}

+ {"global_step": 35000, "epoch_step": 1, "epoch": 2, "exhausted_backends": ["pixel-art", "signs", "sports", "ethnic", "experimental", "movieposters", "normalnudes", "yoga", "cinemamix-1mp", "architecture", "moviecollection", "shutterstock", "nsfw-1024", "photo-aesthetics", "bg20k-1024"], "repeats": {"bookcovers": 0, "signs": 0, "normalnudes": 0, "nijijourney": 0, "movieposters": 0, "celebrities": 0, "pixel-art": 0, "propagandaposters": 0, "sports": 0, "moviecollection": 0, "gay": 0, "experimental": 0, "yoga": 0, "ethnic": 0, "cinemamix-1mp": 0, "architecture": 0, "mj-60": 0, "text-1mp": 13, "shutterstock": 0, "nsfw-1024": 0, "photo-aesthetics": 0, "anatomy": 5, "bg20k-1024": 0, "sfwbooru": 0, "midjourney-v6-520k-raw": 0, "nijijourney-v6-520k-raw": 0, "photo-concept-bucket": 0, "dalle3": 0}}

transformer/diffusion_pytorch_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:de41e493e14186d332e98bf30de94bd8bd79f620644945a3ec8c7e0e0a28b1d9
 size 1816969728

 version https://git-lfs.github.com/spec/v1
+oid sha256:aef80d4100f990ad3a9d7360f9987bba3a554d5e33f4e9225fa01998f938d5d4
 size 1816969728