Adding `safetensors` variant of this model

This is an automated PR created with https://huggingface.co/spaces/safetensors/convert

This new file is equivalent to `pytorch_model.bin` but safe in the sense that
no arbitrary code can be put into it.

These files also happen to load much faster than their pytorch counterpart:
https://colab.research.google.com/github/huggingface/notebooks/blob/main/safetensors_doc/en/speed.ipynb

The widgets on your model page will run using this model even if this is not merged
making sure the file actually works.

If you find any issues: please report here: https://huggingface.co/spaces/safetensors/convert/discussions

Feel free to ignore this PR.

Files changed (7) hide show

model-00001-of-00006.safetensors +3 -0
model-00002-of-00006.safetensors +3 -0
model-00003-of-00006.safetensors +3 -0
model-00004-of-00006.safetensors +3 -0
model-00005-of-00006.safetensors +3 -0
model-00006-of-00006.safetensors +3 -0
model.safetensors.index.json +405 -0

model-00001-of-00006.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6aa4934afaba9848ea231fb420b4d88d0698a25d9b1ec420b35d60c8b132d0d6
+size 994321960

model-00002-of-00006.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:95276d67b051ca0c5710a9ca6fc2c3f6e813bb7851e27eb3c996652ce60580a1
+size 990373064

model-00003-of-00006.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:54aaad6f6959a7e73da8defc53d0b4c8649feabfa8a35d313a065fb0d77689dd
+size 990389704

model-00004-of-00006.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:09bf953d03d8a4c420d500fa2eb4275be1162ab3b18d1b3d0bdd4954c88b3585
+size 990389760

model-00005-of-00006.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5e7de5967310dee76f0d6400ae83baa4db72df81889508c0e0351ffcf81af05a
+size 990389752

model-00006-of-00006.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c459603cedba11419871a1997366619791a8a06e6814433882063aa2d1c85b17
+size 948411248

model.safetensors.index.json ADDED Viewed

	@@ -0,0 +1,405 @@

+{
+    "metadata": {
+        "total_size": 5904482288
+    },
+    "weight_map": {
+        "cls.predictions.bias": "model-00006-of-00006.safetensors",
+        "cls.predictions.decoder.bias": "model-00006-of-00006.safetensors",
+        "cls.predictions.decoder.weight": "model-00006-of-00006.safetensors",
+        "cls.predictions.transform.LayerNorm.bias": "model-00006-of-00006.safetensors",
+        "cls.predictions.transform.LayerNorm.weight": "model-00006-of-00006.safetensors",
+        "cls.predictions.transform.dense.bias": "model-00006-of-00006.safetensors",
+        "cls.predictions.transform.dense.weight": "model-00006-of-00006.safetensors",
+        "deberta.embeddings.LayerNorm.bias": "model-00001-of-00006.safetensors",
+        "deberta.embeddings.LayerNorm.weight": "model-00001-of-00006.safetensors",
+        "deberta.embeddings.position_ids": "model-00001-of-00006.safetensors",
+        "deberta.embeddings.word_embeddings.weight": "model-00001-of-00006.safetensors",
+        "deberta.encoder.LayerNorm.bias": "model-00006-of-00006.safetensors",
+        "deberta.encoder.LayerNorm.weight": "model-00006-of-00006.safetensors",
+        "deberta.encoder.layer.0.attention.output.LayerNorm.bias": "model-00001-of-00006.safetensors",
+        "deberta.encoder.layer.0.attention.output.LayerNorm.weight": "model-00001-of-00006.safetensors",
+        "deberta.encoder.layer.0.attention.output.dense.bias": "model-00001-of-00006.safetensors",
+        "deberta.encoder.layer.0.attention.output.dense.weight": "model-00001-of-00006.safetensors",
+        "deberta.encoder.layer.0.attention.self.key_proj.bias": "model-00001-of-00006.safetensors",
+        "deberta.encoder.layer.0.attention.self.key_proj.weight": "model-00001-of-00006.safetensors",
+        "deberta.encoder.layer.0.attention.self.query_proj.bias": "model-00001-of-00006.safetensors",
+        "deberta.encoder.layer.0.attention.self.query_proj.weight": "model-00001-of-00006.safetensors",
+        "deberta.encoder.layer.0.attention.self.value_proj.bias": "model-00001-of-00006.safetensors",
+        "deberta.encoder.layer.0.attention.self.value_proj.weight": "model-00001-of-00006.safetensors",
+        "deberta.encoder.layer.0.intermediate.dense.bias": "model-00001-of-00006.safetensors",
+        "deberta.encoder.layer.0.intermediate.dense.weight": "model-00001-of-00006.safetensors",
+        "deberta.encoder.layer.0.output.LayerNorm.bias": "model-00001-of-00006.safetensors",
+        "deberta.encoder.layer.0.output.LayerNorm.weight": "model-00001-of-00006.safetensors",
+        "deberta.encoder.layer.0.output.dense.bias": "model-00001-of-00006.safetensors",
+        "deberta.encoder.layer.0.output.dense.weight": "model-00001-of-00006.safetensors",
+        "deberta.encoder.layer.1.attention.output.LayerNorm.bias": "model-00001-of-00006.safetensors",
+        "deberta.encoder.layer.1.attention.output.LayerNorm.weight": "model-00001-of-00006.safetensors",
+        "deberta.encoder.layer.1.attention.output.dense.bias": "model-00001-of-00006.safetensors",
+        "deberta.encoder.layer.1.attention.output.dense.weight": "model-00001-of-00006.safetensors",
+        "deberta.encoder.layer.1.attention.self.key_proj.bias": "model-00001-of-00006.safetensors",
+        "deberta.encoder.layer.1.attention.self.key_proj.weight": "model-00001-of-00006.safetensors",
+        "deberta.encoder.layer.1.attention.self.query_proj.bias": "model-00001-of-00006.safetensors",
+        "deberta.encoder.layer.1.attention.self.query_proj.weight": "model-00001-of-00006.safetensors",
+        "deberta.encoder.layer.1.attention.self.value_proj.bias": "model-00001-of-00006.safetensors",
+        "deberta.encoder.layer.1.attention.self.value_proj.weight": "model-00001-of-00006.safetensors",
+        "deberta.encoder.layer.1.intermediate.dense.bias": "model-00001-of-00006.safetensors",
+        "deberta.encoder.layer.1.intermediate.dense.weight": "model-00001-of-00006.safetensors",
+        "deberta.encoder.layer.1.output.LayerNorm.bias": "model-00001-of-00006.safetensors",
+        "deberta.encoder.layer.1.output.LayerNorm.weight": "model-00001-of-00006.safetensors",
+        "deberta.encoder.layer.1.output.dense.bias": "model-00001-of-00006.safetensors",
+        "deberta.encoder.layer.1.output.dense.weight": "model-00001-of-00006.safetensors",
+        "deberta.encoder.layer.10.attention.output.LayerNorm.bias": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.10.attention.output.LayerNorm.weight": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.10.attention.output.dense.bias": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.10.attention.output.dense.weight": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.10.attention.self.key_proj.bias": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.10.attention.self.key_proj.weight": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.10.attention.self.query_proj.bias": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.10.attention.self.query_proj.weight": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.10.attention.self.value_proj.bias": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.10.attention.self.value_proj.weight": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.10.intermediate.dense.bias": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.10.intermediate.dense.weight": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.10.output.LayerNorm.bias": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.10.output.LayerNorm.weight": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.10.output.dense.bias": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.10.output.dense.weight": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.11.attention.output.LayerNorm.bias": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.11.attention.output.LayerNorm.weight": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.11.attention.output.dense.bias": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.11.attention.output.dense.weight": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.11.attention.self.key_proj.bias": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.11.attention.self.key_proj.weight": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.11.attention.self.query_proj.bias": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.11.attention.self.query_proj.weight": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.11.attention.self.value_proj.bias": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.11.attention.self.value_proj.weight": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.11.intermediate.dense.bias": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.11.intermediate.dense.weight": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.11.output.LayerNorm.bias": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.11.output.LayerNorm.weight": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.11.output.dense.bias": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.11.output.dense.weight": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.12.attention.output.LayerNorm.bias": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.12.attention.output.LayerNorm.weight": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.12.attention.output.dense.bias": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.12.attention.output.dense.weight": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.12.attention.self.key_proj.bias": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.12.attention.self.key_proj.weight": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.12.attention.self.query_proj.bias": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.12.attention.self.query_proj.weight": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.12.attention.self.value_proj.bias": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.12.attention.self.value_proj.weight": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.12.intermediate.dense.bias": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.12.intermediate.dense.weight": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.12.output.LayerNorm.bias": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.12.output.LayerNorm.weight": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.12.output.dense.bias": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.12.output.dense.weight": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.13.attention.output.LayerNorm.bias": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.13.attention.output.LayerNorm.weight": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.13.attention.output.dense.bias": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.13.attention.output.dense.weight": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.13.attention.self.key_proj.bias": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.13.attention.self.key_proj.weight": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.13.attention.self.query_proj.bias": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.13.attention.self.query_proj.weight": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.13.attention.self.value_proj.bias": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.13.attention.self.value_proj.weight": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.13.intermediate.dense.bias": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.13.intermediate.dense.weight": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.13.output.LayerNorm.bias": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.13.output.LayerNorm.weight": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.13.output.dense.bias": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.13.output.dense.weight": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.14.attention.output.LayerNorm.bias": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.14.attention.output.LayerNorm.weight": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.14.attention.output.dense.bias": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.14.attention.output.dense.weight": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.14.attention.self.key_proj.bias": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.14.attention.self.key_proj.weight": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.14.attention.self.query_proj.bias": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.14.attention.self.query_proj.weight": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.14.attention.self.value_proj.bias": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.14.attention.self.value_proj.weight": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.14.intermediate.dense.bias": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.14.intermediate.dense.weight": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.14.output.LayerNorm.bias": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.14.output.LayerNorm.weight": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.14.output.dense.bias": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.14.output.dense.weight": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.15.attention.output.LayerNorm.bias": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.15.attention.output.LayerNorm.weight": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.15.attention.output.dense.bias": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.15.attention.output.dense.weight": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.15.attention.self.key_proj.bias": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.15.attention.self.key_proj.weight": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.15.attention.self.query_proj.bias": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.15.attention.self.query_proj.weight": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.15.attention.self.value_proj.bias": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.15.attention.self.value_proj.weight": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.15.intermediate.dense.bias": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.15.intermediate.dense.weight": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.15.output.LayerNorm.bias": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.15.output.LayerNorm.weight": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.15.output.dense.bias": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.15.output.dense.weight": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.16.attention.output.LayerNorm.bias": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.16.attention.output.LayerNorm.weight": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.16.attention.output.dense.bias": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.16.attention.output.dense.weight": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.16.attention.self.key_proj.bias": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.16.attention.self.key_proj.weight": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.16.attention.self.query_proj.bias": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.16.attention.self.query_proj.weight": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.16.attention.self.value_proj.bias": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.16.attention.self.value_proj.weight": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.16.intermediate.dense.bias": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.16.intermediate.dense.weight": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.16.output.LayerNorm.bias": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.16.output.LayerNorm.weight": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.16.output.dense.bias": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.16.output.dense.weight": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.17.attention.output.LayerNorm.bias": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.17.attention.output.LayerNorm.weight": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.17.attention.output.dense.bias": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.17.attention.output.dense.weight": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.17.attention.self.key_proj.bias": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.17.attention.self.key_proj.weight": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.17.attention.self.query_proj.bias": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.17.attention.self.query_proj.weight": "model-00004-of-00006.safetensors",
+        "deberta.encoder.layer.17.attention.self.value_proj.bias": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.17.attention.self.value_proj.weight": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.17.intermediate.dense.bias": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.17.intermediate.dense.weight": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.17.output.LayerNorm.bias": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.17.output.LayerNorm.weight": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.17.output.dense.bias": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.17.output.dense.weight": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.18.attention.output.LayerNorm.bias": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.18.attention.output.LayerNorm.weight": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.18.attention.output.dense.bias": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.18.attention.output.dense.weight": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.18.attention.self.key_proj.bias": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.18.attention.self.key_proj.weight": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.18.attention.self.query_proj.bias": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.18.attention.self.query_proj.weight": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.18.attention.self.value_proj.bias": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.18.attention.self.value_proj.weight": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.18.intermediate.dense.bias": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.18.intermediate.dense.weight": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.18.output.LayerNorm.bias": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.18.output.LayerNorm.weight": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.18.output.dense.bias": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.18.output.dense.weight": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.19.attention.output.LayerNorm.bias": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.19.attention.output.LayerNorm.weight": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.19.attention.output.dense.bias": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.19.attention.output.dense.weight": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.19.attention.self.key_proj.bias": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.19.attention.self.key_proj.weight": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.19.attention.self.query_proj.bias": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.19.attention.self.query_proj.weight": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.19.attention.self.value_proj.bias": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.19.attention.self.value_proj.weight": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.19.intermediate.dense.bias": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.19.intermediate.dense.weight": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.19.output.LayerNorm.bias": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.19.output.LayerNorm.weight": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.19.output.dense.bias": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.19.output.dense.weight": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.2.attention.output.LayerNorm.bias": "model-00001-of-00006.safetensors",
+        "deberta.encoder.layer.2.attention.output.LayerNorm.weight": "model-00001-of-00006.safetensors",
+        "deberta.encoder.layer.2.attention.output.dense.bias": "model-00001-of-00006.safetensors",
+        "deberta.encoder.layer.2.attention.output.dense.weight": "model-00001-of-00006.safetensors",
+        "deberta.encoder.layer.2.attention.self.key_proj.bias": "model-00001-of-00006.safetensors",
+        "deberta.encoder.layer.2.attention.self.key_proj.weight": "model-00001-of-00006.safetensors",
+        "deberta.encoder.layer.2.attention.self.query_proj.bias": "model-00001-of-00006.safetensors",
+        "deberta.encoder.layer.2.attention.self.query_proj.weight": "model-00001-of-00006.safetensors",
+        "deberta.encoder.layer.2.attention.self.value_proj.bias": "model-00001-of-00006.safetensors",
+        "deberta.encoder.layer.2.attention.self.value_proj.weight": "model-00001-of-00006.safetensors",
+        "deberta.encoder.layer.2.intermediate.dense.bias": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.2.intermediate.dense.weight": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.2.output.LayerNorm.bias": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.2.output.LayerNorm.weight": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.2.output.dense.bias": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.2.output.dense.weight": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.20.attention.output.LayerNorm.bias": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.20.attention.output.LayerNorm.weight": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.20.attention.output.dense.bias": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.20.attention.output.dense.weight": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.20.attention.self.key_proj.bias": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.20.attention.self.key_proj.weight": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.20.attention.self.query_proj.bias": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.20.attention.self.query_proj.weight": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.20.attention.self.value_proj.bias": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.20.attention.self.value_proj.weight": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.20.intermediate.dense.bias": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.20.intermediate.dense.weight": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.20.output.LayerNorm.bias": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.20.output.LayerNorm.weight": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.20.output.dense.bias": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.20.output.dense.weight": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.21.attention.output.LayerNorm.bias": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.21.attention.output.LayerNorm.weight": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.21.attention.output.dense.bias": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.21.attention.output.dense.weight": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.21.attention.self.key_proj.bias": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.21.attention.self.key_proj.weight": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.21.attention.self.query_proj.bias": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.21.attention.self.query_proj.weight": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.21.attention.self.value_proj.bias": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.21.attention.self.value_proj.weight": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.21.intermediate.dense.bias": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.21.intermediate.dense.weight": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.21.output.LayerNorm.bias": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.21.output.LayerNorm.weight": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.21.output.dense.bias": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.21.output.dense.weight": "model-00005-of-00006.safetensors",
+        "deberta.encoder.layer.22.attention.output.LayerNorm.bias": "model-00006-of-00006.safetensors",
+        "deberta.encoder.layer.22.attention.output.LayerNorm.weight": "model-00006-of-00006.safetensors",
+        "deberta.encoder.layer.22.attention.output.dense.bias": "model-00006-of-00006.safetensors",
+        "deberta.encoder.layer.22.attention.output.dense.weight": "model-00006-of-00006.safetensors",
+        "deberta.encoder.layer.22.attention.self.key_proj.bias": "model-00006-of-00006.safetensors",
+        "deberta.encoder.layer.22.attention.self.key_proj.weight": "model-00006-of-00006.safetensors",
+        "deberta.encoder.layer.22.attention.self.query_proj.bias": "model-00006-of-00006.safetensors",
+        "deberta.encoder.layer.22.attention.self.query_proj.weight": "model-00006-of-00006.safetensors",
+        "deberta.encoder.layer.22.attention.self.value_proj.bias": "model-00006-of-00006.safetensors",
+        "deberta.encoder.layer.22.attention.self.value_proj.weight": "model-00006-of-00006.safetensors",
+        "deberta.encoder.layer.22.intermediate.dense.bias": "model-00006-of-00006.safetensors",
+        "deberta.encoder.layer.22.intermediate.dense.weight": "model-00006-of-00006.safetensors",
+        "deberta.encoder.layer.22.output.LayerNorm.bias": "model-00006-of-00006.safetensors",
+        "deberta.encoder.layer.22.output.LayerNorm.weight": "model-00006-of-00006.safetensors",
+        "deberta.encoder.layer.22.output.dense.bias": "model-00006-of-00006.safetensors",
+        "deberta.encoder.layer.22.output.dense.weight": "model-00006-of-00006.safetensors",
+        "deberta.encoder.layer.23.attention.output.LayerNorm.bias": "model-00006-of-00006.safetensors",
+        "deberta.encoder.layer.23.attention.output.LayerNorm.weight": "model-00006-of-00006.safetensors",
+        "deberta.encoder.layer.23.attention.output.dense.bias": "model-00006-of-00006.safetensors",
+        "deberta.encoder.layer.23.attention.output.dense.weight": "model-00006-of-00006.safetensors",
+        "deberta.encoder.layer.23.attention.self.key_proj.bias": "model-00006-of-00006.safetensors",
+        "deberta.encoder.layer.23.attention.self.key_proj.weight": "model-00006-of-00006.safetensors",
+        "deberta.encoder.layer.23.attention.self.query_proj.bias": "model-00006-of-00006.safetensors",
+        "deberta.encoder.layer.23.attention.self.query_proj.weight": "model-00006-of-00006.safetensors",
+        "deberta.encoder.layer.23.attention.self.value_proj.bias": "model-00006-of-00006.safetensors",
+        "deberta.encoder.layer.23.attention.self.value_proj.weight": "model-00006-of-00006.safetensors",
+        "deberta.encoder.layer.23.intermediate.dense.bias": "model-00006-of-00006.safetensors",
+        "deberta.encoder.layer.23.intermediate.dense.weight": "model-00006-of-00006.safetensors",
+        "deberta.encoder.layer.23.output.LayerNorm.bias": "model-00006-of-00006.safetensors",
+        "deberta.encoder.layer.23.output.LayerNorm.weight": "model-00006-of-00006.safetensors",
+        "deberta.encoder.layer.23.output.dense.bias": "model-00006-of-00006.safetensors",
+        "deberta.encoder.layer.23.output.dense.weight": "model-00006-of-00006.safetensors",
+        "deberta.encoder.layer.3.attention.output.LayerNorm.bias": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.3.attention.output.LayerNorm.weight": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.3.attention.output.dense.bias": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.3.attention.output.dense.weight": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.3.attention.self.key_proj.bias": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.3.attention.self.key_proj.weight": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.3.attention.self.query_proj.bias": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.3.attention.self.query_proj.weight": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.3.attention.self.value_proj.bias": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.3.attention.self.value_proj.weight": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.3.intermediate.dense.bias": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.3.intermediate.dense.weight": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.3.output.LayerNorm.bias": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.3.output.LayerNorm.weight": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.3.output.dense.bias": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.3.output.dense.weight": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.4.attention.output.LayerNorm.bias": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.4.attention.output.LayerNorm.weight": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.4.attention.output.dense.bias": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.4.attention.output.dense.weight": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.4.attention.self.key_proj.bias": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.4.attention.self.key_proj.weight": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.4.attention.self.query_proj.bias": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.4.attention.self.query_proj.weight": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.4.attention.self.value_proj.bias": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.4.attention.self.value_proj.weight": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.4.intermediate.dense.bias": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.4.intermediate.dense.weight": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.4.output.LayerNorm.bias": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.4.output.LayerNorm.weight": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.4.output.dense.bias": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.4.output.dense.weight": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.5.attention.output.LayerNorm.bias": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.5.attention.output.LayerNorm.weight": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.5.attention.output.dense.bias": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.5.attention.output.dense.weight": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.5.attention.self.key_proj.bias": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.5.attention.self.key_proj.weight": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.5.attention.self.query_proj.bias": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.5.attention.self.query_proj.weight": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.5.attention.self.value_proj.bias": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.5.attention.self.value_proj.weight": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.5.intermediate.dense.bias": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.5.intermediate.dense.weight": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.5.output.LayerNorm.bias": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.5.output.LayerNorm.weight": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.5.output.dense.bias": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.5.output.dense.weight": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.6.attention.output.LayerNorm.bias": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.6.attention.output.LayerNorm.weight": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.6.attention.output.dense.bias": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.6.attention.output.dense.weight": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.6.attention.self.key_proj.bias": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.6.attention.self.key_proj.weight": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.6.attention.self.query_proj.bias": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.6.attention.self.query_proj.weight": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.6.attention.self.value_proj.bias": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.6.attention.self.value_proj.weight": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.6.intermediate.dense.bias": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.6.intermediate.dense.weight": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.6.output.LayerNorm.bias": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.6.output.LayerNorm.weight": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.6.output.dense.bias": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.6.output.dense.weight": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.7.attention.output.LayerNorm.bias": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.7.attention.output.LayerNorm.weight": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.7.attention.output.dense.bias": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.7.attention.output.dense.weight": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.7.attention.self.key_proj.bias": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.7.attention.self.key_proj.weight": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.7.attention.self.query_proj.bias": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.7.attention.self.query_proj.weight": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.7.attention.self.value_proj.bias": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.7.attention.self.value_proj.weight": "model-00002-of-00006.safetensors",
+        "deberta.encoder.layer.7.intermediate.dense.bias": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.7.intermediate.dense.weight": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.7.output.LayerNorm.bias": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.7.output.LayerNorm.weight": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.7.output.dense.bias": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.7.output.dense.weight": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.8.attention.output.LayerNorm.bias": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.8.attention.output.LayerNorm.weight": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.8.attention.output.dense.bias": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.8.attention.output.dense.weight": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.8.attention.self.key_proj.bias": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.8.attention.self.key_proj.weight": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.8.attention.self.query_proj.bias": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.8.attention.self.query_proj.weight": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.8.attention.self.value_proj.bias": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.8.attention.self.value_proj.weight": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.8.intermediate.dense.bias": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.8.intermediate.dense.weight": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.8.output.LayerNorm.bias": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.8.output.LayerNorm.weight": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.8.output.dense.bias": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.8.output.dense.weight": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.9.attention.output.LayerNorm.bias": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.9.attention.output.LayerNorm.weight": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.9.attention.output.dense.bias": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.9.attention.output.dense.weight": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.9.attention.self.key_proj.bias": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.9.attention.self.key_proj.weight": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.9.attention.self.query_proj.bias": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.9.attention.self.query_proj.weight": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.9.attention.self.value_proj.bias": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.9.attention.self.value_proj.weight": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.9.intermediate.dense.bias": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.9.intermediate.dense.weight": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.9.output.LayerNorm.bias": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.9.output.LayerNorm.weight": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.9.output.dense.bias": "model-00003-of-00006.safetensors",
+        "deberta.encoder.layer.9.output.dense.weight": "model-00003-of-00006.safetensors",
+        "deberta.encoder.rel_embeddings.weight": "model-00006-of-00006.safetensors"
+    }
+}