NetherlandsForensicInstitute
/

robbert-2022-dutch-sentence-transformers

Sentence Similarity

sentence-transformers

feature-extraction

text-embeddings-inference

Model card Files Files and versions

afvanluenen commited on Jul 21, 2023

Commit

18fdb45

·

1 Parent(s): 05894b8

Update README.md

Files changed (1) hide show

README.md +5 -1

README.md CHANGED Viewed

@@ -14,6 +14,10 @@ This is a [sentence-transformers](https://www.SBERT.net) model: It maps sentence
 <!--- Describe your model here -->
 ## Usage (Sentence-Transformers)
 Using this model becomes easy when you have [sentence-transformers](https://www.SBERT.net) installed:
@@ -87,7 +91,7 @@ The model was trained with the parameters:
 `MultiDatasetDataLoader.MultiDatasetDataLoader` of length 414262 with parameters:
 ```
-{'batch_size': 'unknown'}
 ```
 **Loss**:

 <!--- Describe your model here -->
+This model is based on [KU Leuven's RobBERT model](https://huggingface.co/DTAI-KULeuven/robbert-2022-dutch-base).
+It has been finetuned on the [Paraphrase dataset](https://public.ukp.informatik.tu-darmstadt.de/reimers/sentence-transformers/datasets/paraphrases/), which we (machine-) translated to Dutch. The Paraphrase dataset consists of multiple datasets that consist of duo's of similar texts, for example duplicate questions on a forum.
+We have published the translated data that we used to train this model. You can find it [here](link). TODO: insert link!
 ## Usage (Sentence-Transformers)
 Using this model becomes easy when you have [sentence-transformers](https://www.SBERT.net) installed:
 `MultiDatasetDataLoader.MultiDatasetDataLoader` of length 414262 with parameters:
 ```
+{'batch_size': 1}
 ```
 **Loss**: