froggeric
/

WestLake-10.7B-v2-GGUF

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

froggeric commited on Mar 11

Commit

bd8d0cb

•

1 Parent(s): 91c08e4

Update README.md

Files changed (1) hide show

README.md +48 -2

README.md CHANGED Viewed

@@ -1,12 +1,58 @@
 ---
 license: apache-2.0
 language:
 - en
-library_name: transformers
 ---
-![image/png](https://cdn-uploads.huggingface.co/production/uploads/6585ffb10eeafbd678d4b3fe/jnqnl8a_zYYMqJoBpX8yS.png)
 **Update Notes:**
 *Version 2 trained 1 additional epoch cycle for 3 total*

 ---
+base_model:
+- senseable/WestLake-7B-v2
+library_name: transformers
+tags:
+- mergekit
+- merge
 license: apache-2.0
 language:
 - en
 ---
+# WestLake-10.7B-v2
+This is my first viable self-merge of this fantastic model obtained after 12 rounds of testing with different
+merge settings. In my benchmark, it greatly improves over the original 7B model, and ranks between miqu-1-120b
+and goliath-120b! I would describe the improvements as a better writing style, with more details.
+This is a merge of pre-trained language models created using [mergekit](https://github.com/cg123/mergekit).
+## Merge Details
+### Merge Method
+This model was merged using the passthrough merge method.
+### Models Merged
+The following models were included in the merge:
+* [senseable/WestLake-7B-v2](https://huggingface.co/senseable/WestLake-7B-v2)
+### Configuration
+The following YAML configuration was used to produce this model:
+```yaml
+dtype: float16
+merge_method: passthrough
+slices:
+  - sources:
+    - model: senseable/WestLake-7B-v2
+      layer_range: [0,9]
+  - sources:
+    - model: senseable/WestLake-7B-v2
+      layer_range: [5,14]
+  - sources:
+    - model: senseable/WestLake-7B-v2
+      layer_range: [10,19]
+  - sources:
+    - model: senseable/WestLake-7B-v2
+      layer_range: [15,24]
+  - sources:
+    - model: senseable/WestLake-7B-v2
+      layer_range: [20,32]
+```
+---
 **Update Notes:**
 *Version 2 trained 1 additional epoch cycle for 3 total*