petricevich
/

gte-large-en-v1.5

petricevich commited on Sep 6

Commit

6e0e475

•

1 Parent(s): 83a17b1

Upload folder using huggingface_hub

Files changed (1) hide show

config.json CHANGED Viewed

@@ -1,19 +1,17 @@
 {
-  "_name_or_path": "Alibaba-NLP/gte-large-en-v1.5",
   "architectures": [
     "NewModel"
   ],
   "attention_probs_dropout_prob": 0.0,
   "auto_map": {
-    "AutoConfig": "Alibaba-NLP/new-impl--configuration.NewConfig",
-    "AutoModel": "Alibaba-NLP/new-impl--modeling.NewModel",
-    "AutoModelForMaskedLM": "Alibaba-NLP/new-impl--modeling.NewForMaskedLM",
-    "AutoModelForMultipleChoice": "Alibaba-NLP/new-impl--modeling.NewForMultipleChoice",
-    "AutoModelForQuestionAnswering": "Alibaba-NLP/new-impl--modeling.NewForQuestionAnswering",
-    "AutoModelForSequenceClassification": "Alibaba-NLP/new-impl--modeling.NewForSequenceClassification",
-    "AutoModelForTokenClassification": "Alibaba-NLP/new-impl--modeling.NewForTokenClassification"
   },
-  "classifier_dropout": null,
   "hidden_act": "gelu",
   "hidden_dropout_prob": 0.1,
   "hidden_size": 1024,
@@ -21,8 +19,6 @@
   "intermediate_size": 4096,
   "layer_norm_eps": 1e-12,
   "layer_norm_type": "layer_norm",
-  "logn_attention_clip1": false,
-  "logn_attention_scale": false,
   "max_position_embeddings": 8192,
   "model_type": "new",
   "num_attention_heads": 16,
@@ -36,7 +32,7 @@
   },
   "rope_theta": 160000,
   "torch_dtype": "float32",
-  "transformers_version": "4.44.2",
   "type_vocab_size": 2,
   "unpad_inputs": false,
   "use_memory_efficient_attention": false,

 {
   "architectures": [
     "NewModel"
   ],
   "attention_probs_dropout_prob": 0.0,
   "auto_map": {
+    "AutoConfig": "configuration.NewConfig",
+    "AutoModel": "modeling.NewModel",
+    "AutoModelForMaskedLM": "modeling.NewForMaskedLM",
+    "AutoModelForMultipleChoice": "modeling.NewForMultipleChoice",
+    "AutoModelForQuestionAnswering": "modeling.NewForQuestionAnswering",
+    "AutoModelForSequenceClassification": "modeling.NewForSequenceClassification",
+    "AutoModelForTokenClassification": "modeling.NewForTokenClassification"
   },
   "hidden_act": "gelu",
   "hidden_dropout_prob": 0.1,
   "hidden_size": 1024,
   "intermediate_size": 4096,
   "layer_norm_eps": 1e-12,
   "layer_norm_type": "layer_norm",
   "max_position_embeddings": 8192,
   "model_type": "new",
   "num_attention_heads": 16,
   },
   "rope_theta": 160000,
   "torch_dtype": "float32",
+  "transformers_version": "4.39.1",
   "type_vocab_size": 2,
   "unpad_inputs": false,
   "use_memory_efficient_attention": false,