SamaOkasha
/

LaMa-Merged-7__13

SamaOkasha commited on Mar 19

Commit

952ce3a

•

1 Parent(s): 3a7f730

Upload folder using huggingface_hub

Files changed (2) hide show

README.json ADDED Viewed

+---
+{}
+---
+{
+  "license": "apache-2.0",
+  "tags": [
+    "merge",
+    "mergekit",
+    "lazymergekit",
+    "allenai/lama-large-7",
+    "allenai/lama-large-13",
+  ],
+  "model_name": "LaMa-Merged-7__13",
+  "model": "Your Model Information Here",
+  "description": "LaMa-Merged-7__13 is a merge of the following models using mergekit.",
+  "external_datasets": {},
+  "git_repo": "https://github.com/cg123/mergekit",
+  "website": "",
+  "tasks": [],
+  "languages": [],
+  "image": "",
+  "files": [
+    {
+      "filename": "config.json",
+      "type": "yaml",
+      "title": "Configuration"
+    }
+  ],
+  "framework": "",
+  "format": "json",
+  "references": [],
+  "contact": "",
+  "creation_date": "2022-03-21",
+  "authors": [
+    "SamaOkasha"
+  ]
+}

config.json ADDED Viewed

+{
+    "slices": [
+        {
+            "sources": [
+                {
+                    "model": "allenai/lama-large-7",
+                    "layer_range": [
+                        0,
+                        6
+                    ]
+                },
+                {
+                    "model": "allenai/lama-large-13",
+                    "layer_range": [
+                        7,
+                        13
+                    ]
+                }
+            ]
+        }
+    ],
+    "merge_method": "slerp",
+    "base_model": "allenai/lama-large-7",
+    "parameters": {
+        "t": [
+            {
+                "filter": "self_attn",
+                "value": [
+                    0,
+                    0.5,
+                    0.3,
+                    0.7,
+                    1
+                ]
+            },
+            {
+                "filter": "mlp",
+                "value": [
+                    1,
+                    0.5,
+                    0.7,
+                    0.3,
+                    0
+                ]
+            },
+            {
+                "value": 0.5
+            }
+        ]
+    },
+    "dtype": "bfloat16",
+    "model_type": "led"
+}