Upload folder using huggingface_hub

Files changed (5) hide show

2_Dense/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:343f53d79815d1296ed1b563314badea919b8e9eaac97f1cda7df6d563da61fa
-size 2364028

 version https://git-lfs.github.com/spec/v1
+oid sha256:a3a940c1d18f7dc625d5117543c14678721061a2f85350ac6973917ee134f5cc
+size 2363964

README.md CHANGED Viewed

@@ -8,7 +8,7 @@ tags:
 ---
-# LaBSE-veps
 This is a [sentence-transformers](https://www.SBERT.net) model: It maps sentences & paragraphs to a 768 dimensional dense vector space and can be used for tasks like clustering or semantic search.
@@ -28,7 +28,7 @@ Then you can use the model like this:
 from sentence_transformers import SentenceTransformer
 sentences = ["This is an example sentence", "Each sentence is converted"]
-model = SentenceTransformer('Lynxpda/LaBSE-veps')
 embeddings = model.encode(sentences)
 print(embeddings)
 ```
@@ -47,7 +47,7 @@ The model was trained with the parameters:
 **DataLoader**:
-`torch.utils.data.dataloader.DataLoader` of length 334 with parameters:
 ```
 {'batch_size': 8, 'sampler': 'torch.utils.data.sampler.RandomSampler', 'batch_sampler': 'torch.utils.data.sampler.BatchSampler'}
 ```
@@ -62,17 +62,17 @@ The model was trained with the parameters:
 Parameters of the fit()-Method:
 ```
 {
-    "epochs": 5,
     "evaluation_steps": 100,
     "evaluator": "__main__.ChainScoreEvaluator",
     "max_grad_norm": 1,
     "optimizer_class": "<class 'torch.optim.adamw.AdamW'>",
     "optimizer_params": {
-        "lr": 1e-05
     },
     "scheduler": "warmupcosine",
     "steps_per_epoch": null,
-    "warmup_steps": 500,
     "weight_decay": 0.01
 }
 ```

 ---
+# {MODEL_NAME}
 This is a [sentence-transformers](https://www.SBERT.net) model: It maps sentences & paragraphs to a 768 dimensional dense vector space and can be used for tasks like clustering or semantic search.
 from sentence_transformers import SentenceTransformer
 sentences = ["This is an example sentence", "Each sentence is converted"]
+model = SentenceTransformer('{MODEL_NAME}')
 embeddings = model.encode(sentences)
 print(embeddings)
 ```
 **DataLoader**:
+`torch.utils.data.dataloader.DataLoader` of length 9636 with parameters:
 ```
 {'batch_size': 8, 'sampler': 'torch.utils.data.sampler.RandomSampler', 'batch_sampler': 'torch.utils.data.sampler.BatchSampler'}
 ```
 Parameters of the fit()-Method:
 ```
 {
+    "epochs": 2,
     "evaluation_steps": 100,
     "evaluator": "__main__.ChainScoreEvaluator",
     "max_grad_norm": 1,
     "optimizer_class": "<class 'torch.optim.adamw.AdamW'>",
     "optimizer_params": {
+        "lr": 5e-06
     },
     "scheduler": "warmupcosine",
     "steps_per_epoch": null,
+    "warmup_steps": 1000,
     "weight_decay": 0.01
 }
 ```

config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "_name_or_path": "Lynxpda/LaBSE-veps",
   "architectures": [
     "BertModel"
   ],
@@ -25,7 +25,7 @@
   "pooler_type": "first_token_transform",
   "position_embedding_type": "absolute",
   "torch_dtype": "float32",
-  "transformers_version": "4.38.2",
   "type_vocab_size": 2,
   "use_cache": true,
   "vocab_size": 501153

 {
+  "_name_or_path": "sentence-transformers/LaBSE",
   "architectures": [
     "BertModel"
   ],
   "pooler_type": "first_token_transform",
   "position_embedding_type": "absolute",
   "torch_dtype": "float32",
+  "transformers_version": "4.39.0",
   "type_vocab_size": 2,
   "use_cache": true,
   "vocab_size": 501153

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:abba0b3a86565dc1f2ac9763e3fb4da6762ae12dbc675a81dd810ea0df47866c
 size 1883730160

 version https://git-lfs.github.com/spec/v1
+oid sha256:ad6213cd22a7905cb0bbe03e5f88adb8c0009d1ed34f1cada839a13d43186544
 size 1883730160

tokenizer_config.json CHANGED Viewed

@@ -47,19 +47,12 @@
   "do_lower_case": false,
   "full_tokenizer_file": null,
   "mask_token": "[MASK]",
-  "max_length": 256,
   "model_max_length": 512,
   "never_split": null,
-  "pad_to_multiple_of": null,
   "pad_token": "[PAD]",
-  "pad_token_type_id": 0,
-  "padding_side": "right",
   "sep_token": "[SEP]",
-  "stride": 0,
   "strip_accents": null,
   "tokenize_chinese_chars": true,
   "tokenizer_class": "BertTokenizer",
-  "truncation_side": "right",
-  "truncation_strategy": "longest_first",
   "unk_token": "[UNK]"
 }

   "do_lower_case": false,
   "full_tokenizer_file": null,
   "mask_token": "[MASK]",
   "model_max_length": 512,
   "never_split": null,
   "pad_token": "[PAD]",
   "sep_token": "[SEP]",
   "strip_accents": null,
   "tokenize_chinese_chars": true,
   "tokenizer_class": "BertTokenizer",
   "unk_token": "[UNK]"
 }