animemory commited on Nov 30, 2024

Commit

84481a3

1 Parent(s): 2b334a5

model release

Browse files

Files changed (19) hide show

gallery_demo.png +3 -0
model_index.json +41 -0
scheduler/scheduler_config.json +18 -0
text_encoder/config.json +30 -0
text_encoder/embed_tokens_encoder.pt +3 -0
text_encoder/model.safetensors +3 -0
text_encoder_2/config.json +24 -0
text_encoder_2/linear_proj.pth +3 -0
text_encoder_2/model.safetensors +3 -0
tokenizer/special_tokens_map.json +15 -0
tokenizer/tokenizer.json +3 -0
tokenizer/tokenizer_config.json +21 -0
tokenizer_2/special_tokens_map.json +15 -0
tokenizer_2/tokenizer.json +3 -0
tokenizer_2/tokenizer_config.json +21 -0
unet/config.json +72 -0
unet/diffusion_pytorch_model.safetensors +3 -0
vae/config.json +14 -0
vae/movq_model.safetensors +3 -0

gallery_demo.png ADDED Viewed

Git LFS Details

SHA256: 24327be66776be26ccf718616e717b59996f5a64470125a11cdbdaf7003d2fee
Pointer size: 132 Bytes
Size of remote file: 6.49 MB

model_index.json ADDED Viewed

	@@ -0,0 +1,41 @@

+{
+  "_class_name": "AniMemoryPipeLine",
+  "_diffusers_version": "0.32.0.dev0",
+  "feature_extractor": [
+    null,
+    null
+  ],
+  "force_zeros_for_empty_prompt": true,
+  "image_encoder": [
+    null,
+    null
+  ],
+  "scheduler": [
+    "diffusers",
+    "EulerAncestralDiscreteXPredScheduler"
+  ],
+  "text_encoder": [
+    "animemory",
+    "AniMemoryT5"
+  ],
+  "text_encoder_2": [
+    "animemory",
+    "AniMemoryAltCLip"
+  ],
+  "tokenizer": [
+    "transformers",
+    "XLMRobertaTokenizerFast"
+  ],
+  "tokenizer_2": [
+    "transformers",
+    "XLMRobertaTokenizerFast"
+  ],
+  "unet": [
+    "diffusers",
+    "UNet2DConditionModel"
+  ],
+  "vae": [
+    "animemory",
+    "MoVQ"
+  ]
+}

scheduler/scheduler_config.json ADDED Viewed

	@@ -0,0 +1,18 @@

+{
+  "_class_name": "EulerDiscreteScheduler",
+  "_diffusers_version": "0.26.0",
+  "beta_end": 0.012,
+  "beta_schedule": "scaled_linear",
+  "beta_start": 0.00085,
+  "interpolation_type": "linear",
+  "num_train_timesteps": 1000,
+  "prediction_type": "sample",
+  "rescale_betas_zero_snr": false,
+  "sigma_max": null,
+  "sigma_min": null,
+  "steps_offset": 0,
+  "timestep_spacing": "linspace",
+  "timestep_type": "discrete",
+  "trained_betas": null,
+  "use_karras_sigmas": false
+}

text_encoder/config.json ADDED Viewed

	@@ -0,0 +1,30 @@

+{
+  "architectures": [
+    "T5Stack"
+  ],
+  "d_ff": 10240,
+  "d_kv": 64,
+  "d_model": 4096,
+  "decoder_start_token_id": 0,
+  "dense_act_fn": "gelu_new",
+  "dropout_rate": 0.1,
+  "eos_token_id": 1,
+  "feed_forward_proj": "gated-gelu",
+  "initializer_factor": 1.0,
+  "is_encoder_decoder": false,
+  "is_gated_act": true,
+  "layer_norm_epsilon": 1e-06,
+  "model_type": "t5",
+  "num_decoder_layers": 24,
+  "num_heads": 64,
+  "num_layers": 24,
+  "output_past": true,
+  "pad_token_id": 0,
+  "relative_attention_max_distance": 128,
+  "relative_attention_num_buckets": 32,
+  "tie_word_embeddings": false,
+  "torch_dtype": "bfloat16",
+  "transformers_version": "4.30.2",
+  "use_cache": false,
+  "vocab_size": 32128
+}

text_encoder/embed_tokens_encoder.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3bc67fbe6da33fce1aa34c865d3922821712775b0683cb8d1bcba1cc984ef5db
+size 2048017234

text_encoder/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:422de804d9643e4891081fd49012ec7d21a1a779f7c582ed4e77b54d061e65f7
+size 9261454176

text_encoder_2/config.json ADDED Viewed

	@@ -0,0 +1,24 @@

+{
+  "architectures": [
+    "CLIPTextModelWithProjection"
+  ],
+  "attention_dropout": 0.0,
+  "bos_token_id": 0,
+  "dropout": 0.0,
+  "eos_token_id": 2,
+  "hidden_act": "gelu",
+  "hidden_size": 1280,
+  "initializer_factor": 1.0,
+  "initializer_range": 0.02,
+  "intermediate_size": 5120,
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 77,
+  "model_type": "clip_text_model",
+  "num_attention_heads": 20,
+  "num_hidden_layers": 32,
+  "pad_token_id": 1,
+  "projection_dim": 1280,
+  "torch_dtype": "bfloat16",
+  "transformers_version": "4.30.2",
+  "vocab_size": 250002
+}

text_encoder_2/linear_proj.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:723b47687d823e59f7210dfa3536493a09c08c58d8bde2a9c9d9785f4929e89d
+size 3280439

text_encoder_2/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:afd0cf9f32ae51da28113679291a983858180d4917e30024ccb5341e53fe02e8
+size 1902904456

tokenizer/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,15 @@

+{
+  "bos_token": "<s>",
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "mask_token": {
+    "content": "<mask>",
+    "lstrip": true,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "unk_token": "<unk>"
+}

tokenizer/tokenizer.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d63ea22ce2c646e55084ebcef017e8f0e3cc7e02a9ace03ab1339912fe9d8439
+size 17082729

tokenizer/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,21 @@

+{
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "mask_token": {
+    "__type": "AddedToken",
+    "content": "<mask>",
+    "lstrip": true,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "model_max_length": 77,
+  "pad_token": "<pad>",
+  "processor_class": "AltCLIPProcessor",
+  "sep_token": "</s>",
+  "sp_model_kwargs": {},
+  "tokenizer_class": "XLMRobertaTokenizer",
+  "unk_token": "<unk>"
+}

tokenizer_2/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,15 @@

+{
+  "bos_token": "<s>",
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "mask_token": {
+    "content": "<mask>",
+    "lstrip": true,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "unk_token": "<unk>"
+}

tokenizer_2/tokenizer.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d63ea22ce2c646e55084ebcef017e8f0e3cc7e02a9ace03ab1339912fe9d8439
+size 17082729

tokenizer_2/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,21 @@

+{
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "mask_token": {
+    "__type": "AddedToken",
+    "content": "<mask>",
+    "lstrip": true,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "model_max_length": 77,
+  "pad_token": "<pad>",
+  "processor_class": "AltCLIPProcessor",
+  "sep_token": "</s>",
+  "sp_model_kwargs": {},
+  "tokenizer_class": "XLMRobertaTokenizer",
+  "unk_token": "<unk>"
+}

unet/config.json ADDED Viewed

	@@ -0,0 +1,72 @@

+{
+  "_class_name": "UNet2DConditionModel",
+  "_diffusers_version": "0.26.0",
+  "act_fn": "silu",
+  "addition_embed_type": "text_time",
+  "addition_embed_type_num_heads": 64,
+  "addition_time_embed_dim": 256,
+  "attention_head_dim": [
+    5,
+    10,
+    20
+  ],
+  "attention_type": "default",
+  "block_out_channels": [
+    320,
+    640,
+    1280
+  ],
+  "center_input_sample": false,
+  "class_embed_type": null,
+  "class_embeddings_concat": false,
+  "conv_in_kernel": 3,
+  "conv_out_kernel": 3,
+  "cross_attention_dim": 5376,
+  "cross_attention_norm": null,
+  "down_block_types": [
+    "DownBlock2D",
+    "CrossAttnDownBlock2D",
+    "CrossAttnDownBlock2D"
+  ],
+  "downsample_padding": 1,
+  "dropout": 0.0,
+  "dual_cross_attention": false,
+  "encoder_hid_dim": null,
+  "encoder_hid_dim_type": null,
+  "flip_sin_to_cos": true,
+  "freq_shift": 0,
+  "in_channels": 4,
+  "layers_per_block": 2,
+  "mid_block_only_cross_attention": null,
+  "mid_block_scale_factor": 1,
+  "mid_block_type": "UNetMidBlock2DCrossAttn",
+  "norm_eps": 1e-05,
+  "norm_num_groups": 32,
+  "num_attention_heads": null,
+  "num_class_embeds": null,
+  "only_cross_attention": false,
+  "out_channels": 4,
+  "projection_class_embeddings_input_dim": 2816,
+  "resnet_out_scale_factor": 1.0,
+  "resnet_skip_time_act": false,
+  "resnet_time_scale_shift": "default",
+  "reverse_transformer_layers_per_block": null,
+  "sample_size": 128,
+  "time_cond_proj_dim": null,
+  "time_embedding_act_fn": null,
+  "time_embedding_dim": null,
+  "time_embedding_type": "positional",
+  "timestep_post_act": null,
+  "transformer_layers_per_block": [
+    1,
+    2,
+    10
+  ],
+  "up_block_types": [
+    "CrossAttnUpBlock2D",
+    "CrossAttnUpBlock2D",
+    "UpBlock2D"
+  ],
+  "upcast_attention": null,
+  "use_linear_projection": true
+}

unet/diffusion_pytorch_model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d3aa3a5c6465c99dc895dd0bfe58be376b30d2d53eaab6743e29c149a57f4613
+size 6242710008

vae/config.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+    "double_z": false,
+    "z_channels": 4,
+    "resolution": 256,
+    "in_channels": 3,
+    "out_ch": 3,
+    "ch": 256,
+    "ch_mult": [1, 2, 2, 4],
+    "block_out_channels": [256, 512, 512, 1024],
+    "num_res_blocks": 2,
+    "attn_resolutions": [32],
+    "dropout": 0.0,
+    "scaling_factor": 1.0
+}

vae/movq_model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a58517ff5693662fd98147b58484dc5d9b879dac5e2a0f21389a6de525b27dfd
+size 1082461324