morgul commited on Oct 14

Commit

99e9534

•

1 Parent(s): ef8c8ec

Upload folder using huggingface_hub (#1)

- 9f7ccf3a1b5869265c440ec7687abd8d4a79f092ee64ab15aa01a93587adaea3 (e0e7a350211d18cf4a18a84d00cbd6a15758fc27)
- 8eb74b05f4beffb0d08096ab9d32313593057ac87257ab48c23575be8a67f59a (8c976293d155187de71580b82d88466031e8c684)
- f357b5b3381eb49acb143524eccaad08b302160e70663db26ceacc1447f5fdcb (69f1e702e739de7f37db8edb6c72fc72ad0c27d2)
- 7b49a823aa544e8a754ab4bc77a21d29575a7a0582dfefda57c2ae697fcff458 (c44b517bbebd7d4d5d81b957e7bdca1a086e8a40)
- 5291561befb4e96de04dced2cf371826f7bb41c31c1bafc9a46482e4db41d04e (c5f468fe823fe677aa9c5ec37eabdd7e9c206906)
- 8935840981dffc898ed5bb26865ae8aef832ee96671da0ad92f809553575cf9f (951daed1453f6bdac98884e6a18e10adc51d07e2)
- 45dcb1560f693f5b4d58cae76b17b8d20c672151b1f083d3fafdb9541a2740d1 (1a4761eccfeb7ff1a145c46ac5840af913a4eb3e)
- be2e19a6042958e9879b92a2ddff25d6b3b6ef43566faa1b2fa7417909b6b7e4 (9354e04564a88b19784544e6431f58b8023d9ac4)
- c66f9530135f5dc5465720b589031610d27f9b500a8c22d62f99c1283d27a641 (fa6c2aa5964ec25a336b8b6c3c652d89df6981cf)
- a6d69bbd712d784f0063151d955e2096bc20695c039d325f7562511487fc9d66 (a9c4ebddd2667818b2a076a71f38b2ffc2a9a540)
- d5959d2606681adbe7dbca5563c8b791b7feade89947e6e4a02d7890379884dd (8117ecf94568cd6f3f7d5513735630e1883635e4)
- 17a871e0045ed633579d237c511850616bd219d258a9a5c73fe7bf5fe68b63c2 (c4aa0480f436581edb98267ae18850224c03866a)
- c8de80f973728ade8456ff9bfaa3ff929fce085910ab3e62d4e5f61ce17ded74 (53716b44fde61ad168781e0ecee52c89eda02847)
- b7dd69b4a4184ad0d7ca8b8cfb8d3463b68c927f7b5af322833f60736cf9b04f (907af4513d568036390cef237d3144752f1052d5)
- e838c653f46e6b7de60f161f3027d22ba5f4092c90a4d688dfbb605e3df26880 (3b319e46b9c966b1cad69c87de3a5da5dca0b039)
- 4ef345d6a1cdbcbaf363095fe970794c2477d6a6d4414d79c205c42edc226d18 (b16ad286c6ff082a6b7e43cd1cc3fab1b4f608b5)

Files changed (23) hide show

README.md +32 -0
config.json +38 -0
model-00001-of-00016.safetensors +3 -0
model-00002-of-00016.safetensors +3 -0
model-00003-of-00016.safetensors +3 -0
model-00004-of-00016.safetensors +3 -0
model-00005-of-00016.safetensors +3 -0
model-00006-of-00016.safetensors +3 -0
model-00007-of-00016.safetensors +3 -0
model-00008-of-00016.safetensors +3 -0
model-00009-of-00016.safetensors +3 -0
model-00010-of-00016.safetensors +3 -0
model-00011-of-00016.safetensors +3 -0
model-00012-of-00016.safetensors +3 -0
model-00013-of-00016.safetensors +3 -0
model-00014-of-00016.safetensors +3 -0
model-00015-of-00016.safetensors +3 -0
model-00016-of-00016.safetensors +3 -0
model.safetensors.index.json +0 -0
special_tokens_map.json +30 -0
tokenizer.json +0 -0
tokenizer.model +3 -0
tokenizer_config.json +45 -0

README.md ADDED Viewed

	@@ -0,0 +1,32 @@

+---
+base_model: rAIfle/SorcererLM-8x22b-bf16
+license: apache-2.0
+tags:
+- mlx
+---
+# mlx-community/SorcererLM-8x22b-4bit
+The Model [mlx-community/SorcererLM-8x22b-4bit](https://huggingface.co/mlx-community/SorcererLM-8x22b-4bit) was converted to MLX format from [rAIfle/SorcererLM-8x22b-bf16](https://huggingface.co/rAIfle/SorcererLM-8x22b-bf16) using mlx-lm version **0.19.0**.
+## Use with mlx
+```bash
+pip install mlx-lm
+```
+```python
+from mlx_lm import load, generate
+model, tokenizer = load("mlx-community/SorcererLM-8x22b-4bit")
+prompt="hello"
+if hasattr(tokenizer, "apply_chat_template") and tokenizer.chat_template is not None:
+    messages = [{"role": "user", "content": prompt}]
+    prompt = tokenizer.apply_chat_template(
+        messages, tokenize=False, add_generation_prompt=True
+    )
+response = generate(model, tokenizer, prompt=prompt, verbose=True)
+```

config.json ADDED Viewed

	@@ -0,0 +1,38 @@

+{
+    "architectures": [
+        "MixtralForCausalLM"
+    ],
+    "attention_dropout": 0.0,
+    "bos_token_id": 1,
+    "eos_token_id": 2,
+    "hidden_act": "silu",
+    "hidden_size": 6144,
+    "initializer_range": 0.02,
+    "intermediate_size": 16384,
+    "max_position_embeddings": 65536,
+    "model_type": "mixtral",
+    "num_attention_heads": 48,
+    "num_experts_per_tok": 2,
+    "num_hidden_layers": 56,
+    "num_key_value_heads": 8,
+    "num_local_experts": 8,
+    "output_router_logits": false,
+    "quantization": {
+        "group_size": 64,
+        "bits": 4
+    },
+    "quantization_config": {
+        "group_size": 64,
+        "bits": 4
+    },
+    "rms_norm_eps": 1e-05,
+    "rope_theta": 1000000,
+    "router_aux_loss_coef": 0.001,
+    "router_jitter_noise": 0.0,
+    "sliding_window": null,
+    "tie_word_embeddings": false,
+    "torch_dtype": "bfloat16",
+    "transformers_version": "4.45.0.dev0",
+    "use_cache": false,
+    "vocab_size": 32000
+}

model-00001-of-00016.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7b46ac1e31220fa1cb133baf77df7da2976c9e94b9842f59d3eb95b1f078b507
+size 5291802737

model-00002-of-00016.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7a2bc2a2d32a46a8d081b56657656273256d20c6efeca250f44df29a0001c754
+size 5181235243

model-00003-of-00016.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e62237fd299e53cadfdbb82cd89978e95e483955c9103474de8437d5f94927b8
+size 5181235208

model-00004-of-00016.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cf11f618c4e58e51d57b2cc441fe311d6e8ab76e795dc47b117a18efbdb18143
+size 5131635931

model-00005-of-00016.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:03490b11a2822f2825e4238673d9690f0fe1a84d20e66e07e27df2fbe27c6a44
+size 5181235326

model-00006-of-00016.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1ac453cb7ba06fb5efa478b2a9618f3996c8affd90a5aff4417f7e723a3a22bf
+size 5181235312

model-00007-of-00016.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5b782d7398d10bb14e3f9c02bc7d231e625a707794316f9616244b9d063db00e
+size 5131635949

model-00008-of-00016.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7a62120931c0c263b2bd92277985c4a0c076ecd7f0506f4f139dd8387f640fa3
+size 5181235342

model-00009-of-00016.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c12053f53d0515fd5f24deed88f4127d3a1a9bb966bd54a3c683e09257e4f911
+size 5181235294

model-00010-of-00016.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4bb89d969771943cb39e9a0a308260db3e0877365c5b65a104f59c7dfeabe0f2
+size 5131635917

model-00011-of-00016.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ba5a78dbdaa8a6293868ab5869ae2eca7953463121fb09b929bae6a54d174c0e
+size 5181235346

model-00012-of-00016.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9798d8a3b8337e63378f7481d2bd32937cda52b35d65755cb7a034cc61d6f0d2
+size 5181235292

model-00013-of-00016.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f50cb1d11d02a9f20468aa15e1fe2ca8ad203371ad74b217d8c6b754bb44fa05
+size 5131635939

model-00014-of-00016.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6cef94b43129ef943a9c6de2139bef83a04b7b0cd3f67843001d368d17409364
+size 5181235376

model-00015-of-00016.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:41040d08d596c9c24409f08e5e862d5be5230413d4d2dd0f3bf21f1ccfe274b5
+size 5181235324

model-00016-of-00016.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6bb8239c951f4e8b1194ef69068036200b2c1d3fe16306de8d47171ce36b8741
+size 1469585211

model.safetensors.index.json ADDED Viewed

The diff for this file is too large to render. See raw diff

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,30 @@

+{
+  "bos_token": {
+    "content": "<s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eos_token": {
+    "content": "</s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": {
+    "content": "<unk>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "unk_token": {
+    "content": "<unk>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  }
+}

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer.model ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:dadfd56d766715c61d2ef780a525ab43b8e6da4de6865bda3d95fdef5e134055
+size 493443

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,45 @@

+{
+  "add_bos_token": true,
+  "add_eos_token": false,
+  "add_prefix_space": true,
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<unk>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "additional_special_tokens": [],
+  "bos_token": "<s>",
+  "chat_template": "{% if messages[0]['role'] == 'system' %}{% set loop_messages = messages[1:] %}{{ messages[0]['content'].strip() }}{% else %}{% set loop_messages = messages %}{{ 'A chat between a curious user and an artificial intelligence assistant. The assistant gives helpful, detailed, and polite answers to the user\\'s questions.' }}{% endif %}{% for message in loop_messages %}{% if loop.index0 == 0 %}{% if message['role'] == 'system' or message['role'] == 'user' %}{{ ' USER: ' + message['content'].strip() }}{% else %}{{ ' ASSISTANT: ' + message['content'].strip() + eos_token }}{% endif %}{% else %}{% if message['role'] == 'system' or message['role'] == 'user' %}{{ '\nUSER: ' + message['content'].strip() }}{% else %}{{ ' ASSISTANT: ' + message['content'].strip() + eos_token }}{% endif %}{% endif %}{% endfor %}{% if add_generation_prompt %}{{ ' ASSISTANT:' }}{% endif %}",
+  "clean_up_tokenization_spaces": false,
+  "eos_token": "</s>",
+  "legacy": true,
+  "model_max_length": 1000000000000000019884624838656,
+  "pad_token": "<unk>",
+  "padding_side": "right",
+  "sp_model_kwargs": {},
+  "spaces_between_special_tokens": false,
+  "tokenizer_class": "LlamaTokenizer",
+  "unk_token": "<unk>",
+  "use_default_system_prompt": true
+}