bge-m3-griffai-finetuned / README.md

cimi86

Add new SentenceTransformer model.

be91a73 verified 14 days ago

preview code

raw

history blame contribute delete

No virus

31.6 kB

	---
	base_model: BAAI/bge-m3
	datasets: []
	language: []
	library_name: sentence-transformers
	metrics:
	- cosine_accuracy@1
	- cosine_accuracy@3
	- cosine_accuracy@5
	- cosine_accuracy@10
	- cosine_precision@1
	- cosine_precision@3
	- cosine_precision@5
	- cosine_precision@10
	- cosine_recall@1
	- cosine_recall@3
	- cosine_recall@5
	- cosine_recall@10
	- cosine_ndcg@10
	- cosine_mrr@10
	- cosine_map@3
	- cosine_map@5
	- cosine_map@10
	- dot_accuracy@1
	- dot_accuracy@3
	- dot_accuracy@5
	- dot_accuracy@10
	- dot_precision@1
	- dot_precision@3
	- dot_precision@5
	- dot_precision@10
	- dot_recall@1
	- dot_recall@3
	- dot_recall@5
	- dot_recall@10
	- dot_ndcg@10
	- dot_mrr@10
	- dot_map@3
	- dot_map@5
	- dot_map@10
	pipeline_tag: sentence-similarity
	tags:
	- sentence-transformers
	- sentence-similarity
	- feature-extraction
	- generated_from_trainer
	- dataset_size:5903
	- loss:MultipleNegativesRankingLoss
	widget:
	- source_sentence: 'fldhelyével és tipusa:U. Arra a tételre kell ráállni, amelyik
	kivezetés bizonylatát és átadott eszközét át akarjuk venni. Eszköz válogatás-ra
	kattintva a kivezetés (átadás) bizonylat tételeiből lehet szelektálni. Amennyiben
	az Eszköz válogatással nem szelektálunk, az átadó bizonylaton szereplő valamennyi
	eszköz átvételre kerül. Az időszak, a beléptető fldhely,az átvevő bizonylat dátuma
	megegyezik az átadó bizonylat időszakával és dátumával. Megadandó: · Új kezelő
	eek, · Új szervezeti egység (eek nem kötelező) · Átvétel bizonylati tömb (KESXE01)
	egyéb növekedés · Átvétel mozgásnem (KESXE01) egyéb növekedés · Bizonylat nyomtatás
	(I/N) · Új tárhely adatok: Nem/Igen - Igen esetén: Tárolási hely leltárkörzet:
	A [kescti] - Cím adatok tároló ingatlan alapján? készlet alrendszer paraméter
	: Igen értéke esetén: Ha a Leltárkörzet törzsben hozzá van rendelve a megfelelő
	tároló ingatlan akkor rögzítésekor a tároló ingatlan és a hozzá tartozó cím adatok
	is bejegyzésre kerülnek. Itt értékük már nem'
	sentences:
	- Miért kéri az alkalmazás megjeleníteni a kontírozott folyószámlaszámot és árbevételi
	számlát a szerződésben ha a jogcím törzs második oldala nyilvántartási számla
	és elsődleges ellenszámla mezőiben szereplő folyószámlaszámok és árbevételi számlák
	egyeznek meg a szerződésben megjelölt számlaszámokkal?
	- Melyek a feltételek, amelyek alapján az online adatszolgáltatás előkészítő programja
	tölt fel adattal az eredeti számla legutóbbi módosító okiratának sorszámát?
	- Mi a célja az eszközök átvételével kapcsolatos új kezelők regisztrálásának és
	az új szervezeti egység létrehozásának, amikor egyeztetni kell az átadó és átvevő
	bizonylatokat?
	- source_sentence: '(A Szerver oldali dll használat? [csharp] rendszerparaméter értéke
	alapértelmezéstől eltérő 1, Igen esetén, ha a Külső bizonylatszámot a felhasználó
	FST funkcióval felüldefiniálja, akkor az FST-ben definiált maximális hossz alapján
	töltjük a külső bizonylatszámot.) Partnerkód (szárm.) - f_partner PARTNER törzskapcsolat
	Az eszközt szállító/értékesítő partner azonosító kódja. ÉJ (Építményjegyzék) szám
	- f_ej ESZEJ törzskapcsolat Az építmények építményjegyzék szerinti besorolását
	lehet rögzíteni a hatályos építményjegyzéknek megfelelően. Kezelő elszámolási
	egység / Kezelő szervezeti egység - f_keek EGYSEG törzskapcsolat Amennyiben az
	Elszámolási egység törzsben a Státusz, a Nyitás dátuma és a Zárás dátuma mezők
	használatban vannak, az alábbi feltételek teljesülése esetén választhatók ki:
	1. a kód státusza Nyitott és a Nyitás dátuma üres vagy nem nagyobb, mint a viszonyítási
	dátum (aktuális dátum) VAGY 2. a kód státusza Nyitott és a Zárás dátuma nagyobb,
	mint a viszonyítási dátum (aktuális'
	sentences:
	- Milyen hatással bír az a szituáció, amikor az építményjegyzék (ÉJ) szám nem egyezik
	meg a FST-ben definiált maximális hossz alapján töltött külső bizonylatszámmal?
	- Miért történik meg a KT02- bizonylat generálása csak akkor, ha nem adunk meg alszámot?
	- Hogyan ellenőrizhetem, hogy véletlenül megsemmisítettem-e a főkönyvi naplómat?
	- source_sentence: nyezhetők. Itt célszerű vagy előre FST/FJK szűrést beállítani vagy
	a navigáció tölcsér funkciójával szűrést beállítani, hogy csak a bejelentkezett
	felhasználó aláírására váró számlák jelenjenek meg. Iktatókönyv kijelölése után
	aktív a Karbantartás funkció, az aláírandó számlán indítva megjelenik a számla
	fej karbantartó.
	sentences:
	- Mi a bruttó végösszeg, ha 20%-os adót kell befizetni egy olyan számlán, amelyhez
	hozzáadott értékkel megjelölt termékeket forgalmaztak?
	- Milyen kritériumok alapján lesznek meghatározva az összes bejegyzés lehetséges
	típusai a számlákhoz kapcsolódó értékeknél?
	- Miért lenne fontos a navigációs tölcsér funkció használata ahhoz, hogy csak a
	bejelentkezett felhasználó aláírására váró számlák jelenjenek meg az iktatókönyvben?
	- source_sentence: 'y számla akkor eshet így ki a generálásból, ha a dátumai alapján
	a megadott ÁFA-időszaknál későbbi lesz a megállapított ÁFA-időszaka. Ezekre a
	számlákra majd a következő vagy azután következő hónapban kerül sor. (Ezek lehetnek
	a 4 eset közül a 3. és 4. eset.) Könyvelési napló: az ÁFA-telj.dátumnak megfelelő
	N - Nyitott, pénzügyi napló, amibe az ÁFA- rendező bizonylatot generálja a program.
	Generálás hatására megerősítendő kérdést tesz fel: Igen hatására bekéri az ÁFA-rendező
	bizonylat előállításához szükséges adatokat: SZÁLLÍTÓ'
	sentences:
	- Mi lesz a következő lépés, ha a feldolgozási dátum után egy hónappal kiadott számla
	ÁFA-időszaka túllép a 3-4 hónapos időtartamon?
	- Milyen folyamatot követ el az alkalmazás, ha a Számlakép fájlformátuma mezőben
	PDF szerepel és küldéskor átkonvertálja?
	- Mi az oka annak, hogy a program korlátozza az újrakontírozást azokra a kartonokra,
	amelyeken még nincs könyvelt bruttó és/vagy ÉCS sora?
	- source_sentence: '§ Adóalap összege (könyvelt): nettó adóalap § ÁFA összege (könyvelt):
	nettó áfa § Adóalap összege (ÁFA árf) § ÁFA összege (ÁFA árf) Az ÁFA árfolyamos
	adóalap és ÁFA oszlopokba az adott sorban eltárolt ÁFA-árfolyammal kiszámított
	összegek kerülnek, így az ÁFA árfolyamos forint alap és a forint ÁFA százalékosan
	megfelel egymásnak. Egy közösségi, 45 napos listázásánál ez a két összeg megegyezik,
	mivel a 45 napos bizonylat ugyanezzel az árfolyammal lett forintosítva. Hogy jó
	ÁFA-árfolyammal számoljon a program, célszerű az Utólagos forintosítás funkció
	elindítani a bizonylatokra. Az ÁFA-rendező bizonylatokon a mennyiségi egység és
	mennyiség informatíve tartalmazhatja a nettó összeget, ha azt egyébként a nettó
	mezőben nem szerepeltetjük. Ezeket a mezőket az EU-ÁFA-rendező, a Fordított adózás,
	a mínuszos számlákhoz, az eltérő teljesítési idejű számlákhoz, valamint a Felvásárlási
	jegyekhez történő ÁFA-rendező bizonylatok generálása is feltölti, valamint a bizonylatok
	kézi rögzítésénél is tölt'
	sentences:
	- Miért létezik a lehetőség, hogy egy alszámos, egy dimenziós PENZ02 kötvállalást
	egyszerűen és rögzítetlenül feltölthessünk az adatbázisba?
	- Mi lesz a hatása annak, ha bekapcsoljuk a raktári és főkönyvi mennyiség megadását
	a készletmozgások bizonylatolásakor?
	- Miért szükséges az adóalap és az áfa összege megfelelőnek lennie egy 45 napos
	listázásnál?
	model-index:
	- name: SentenceTransformer based on BAAI/bge-m3
	results:
	- task:
	type: information-retrieval
	name: Information Retrieval
	dataset:
	name: BAAI/bge m3
	type: BAAI/bge-m3
	metrics:
	- type: cosine_accuracy@1
	value: 0.4481707317073171
	name: Cosine Accuracy@1
	- type: cosine_accuracy@3
	value: 0.6524390243902439
	name: Cosine Accuracy@3
	- type: cosine_accuracy@5
	value: 0.7301829268292683
	name: Cosine Accuracy@5
	- type: cosine_accuracy@10
	value: 0.8246951219512195
	name: Cosine Accuracy@10
	- type: cosine_precision@1
	value: 0.4481707317073171
	name: Cosine Precision@1
	- type: cosine_precision@3
	value: 0.21747967479674796
	name: Cosine Precision@3
	- type: cosine_precision@5
	value: 0.14603658536585362
	name: Cosine Precision@5
	- type: cosine_precision@10
	value: 0.08246951219512194
	name: Cosine Precision@10
	- type: cosine_recall@1
	value: 0.4481707317073171
	name: Cosine Recall@1
	- type: cosine_recall@3
	value: 0.6524390243902439
	name: Cosine Recall@3
	- type: cosine_recall@5
	value: 0.7301829268292683
	name: Cosine Recall@5
	- type: cosine_recall@10
	value: 0.8246951219512195
	name: Cosine Recall@10
	- type: cosine_ndcg@10
	value: 0.6325741777762836
	name: Cosine Ndcg@10
	- type: cosine_mrr@10
	value: 0.5716384775454897
	name: Cosine Mrr@10
	- type: cosine_map@3
	value: 0.5409044715447155
	name: Cosine Map@3
	- type: cosine_map@5
	value: 0.5588922764227642
	name: Cosine Map@5
	- type: cosine_map@10
	value: 0.5716384775454898
	name: Cosine Map@10
	- type: dot_accuracy@1
	value: 0.4481707317073171
	name: Dot Accuracy@1
	- type: dot_accuracy@3
	value: 0.6524390243902439
	name: Dot Accuracy@3
	- type: dot_accuracy@5
	value: 0.7301829268292683
	name: Dot Accuracy@5
	- type: dot_accuracy@10
	value: 0.8246951219512195
	name: Dot Accuracy@10
	- type: dot_precision@1
	value: 0.4481707317073171
	name: Dot Precision@1
	- type: dot_precision@3
	value: 0.21747967479674796
	name: Dot Precision@3
	- type: dot_precision@5
	value: 0.14603658536585362
	name: Dot Precision@5
	- type: dot_precision@10
	value: 0.08246951219512194
	name: Dot Precision@10
	- type: dot_recall@1
	value: 0.4481707317073171
	name: Dot Recall@1
	- type: dot_recall@3
	value: 0.6524390243902439
	name: Dot Recall@3
	- type: dot_recall@5
	value: 0.7301829268292683
	name: Dot Recall@5
	- type: dot_recall@10
	value: 0.8246951219512195
	name: Dot Recall@10
	- type: dot_ndcg@10
	value: 0.6325741777762836
	name: Dot Ndcg@10
	- type: dot_mrr@10
	value: 0.5716384775454897
	name: Dot Mrr@10
	- type: dot_map@3
	value: 0.5409044715447155
	name: Dot Map@3
	- type: dot_map@5
	value: 0.5588922764227642
	name: Dot Map@5
	- type: dot_map@10
	value: 0.5716384775454898
	name: Dot Map@10
	---

	# SentenceTransformer based on BAAI/bge-m3

	This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [BAAI/bge-m3](https://huggingface.co/BAAI/bge-m3). It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.

	## Model Details

	### Model Description
	- Model Type: Sentence Transformer
	- Base model: [BAAI/bge-m3](https://huggingface.co/BAAI/bge-m3) <!-- at revision 5617a9f61b028005a4858fdac845db406aefb181 -->
	- Maximum Sequence Length: 8192 tokens
	- Output Dimensionality: 1024 tokens
	- Similarity Function: Cosine Similarity
	<!-- - Training Dataset: Unknown -->
	<!-- - Language: Unknown -->
	<!-- - License: Unknown -->

	### Model Sources

	- Documentation: [Sentence Transformers Documentation](https://sbert.net)
	- Repository: [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
	- Hugging Face: [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)

	### Full Model Architecture

	```
	SentenceTransformer(
	(0): Transformer({'max_seq_length': 8192, 'do_lower_case': False}) with Transformer model: XLMRobertaModel
	(1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': True, 'pooling_mode_mean_tokens': False, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
	(2): Normalize()
	)
	```

	## Usage

	### Direct Usage (Sentence Transformers)

	First install the Sentence Transformers library:

	```bash
	pip install -U sentence-transformers
	```

	Then you can load this model and run inference.
	```python
	from sentence_transformers import SentenceTransformer

	# Download from the 🤗 Hub
	model = SentenceTransformer("cimi86/bge-m3-griffai-finetuned")
	# Run inference
	sentences = [
	'§ Adóalap összege (könyvelt): nettó adóalap § ÁFA összege (könyvelt): nettó áfa § Adóalap összege (ÁFA árf) § ÁFA összege (ÁFA árf) Az ÁFA árfolyamos adóalap és ÁFA oszlopokba az adott sorban eltárolt ÁFA-árfolyammal kiszámított összegek kerülnek, így az ÁFA árfolyamos forint alap és a forint ÁFA százalékosan megfelel egymásnak. Egy közösségi, 45 napos listázásánál ez a két összeg megegyezik, mivel a 45 napos bizonylat ugyanezzel az árfolyammal lett forintosítva. Hogy jó ÁFA-árfolyammal számoljon a program, célszerű az Utólagos forintosítás funkció elindítani a bizonylatokra. Az ÁFA-rendező bizonylatokon a mennyiségi egység és mennyiség informatíve tartalmazhatja a nettó összeget, ha azt egyébként a nettó mezőben nem szerepeltetjük. Ezeket a mezőket az EU-ÁFA-rendező, a Fordított adózás, a mínuszos számlákhoz, az eltérő teljesítési idejű számlákhoz, valamint a Felvásárlási jegyekhez történő ÁFA-rendező bizonylatok generálása is feltölti, valamint a bizonylatok kézi rögzítésénél is tölt',
	'Miért szükséges az adóalap és az áfa összege megfelelőnek lennie egy 45 napos listázásnál?',
	'Miért létezik a lehetőség, hogy egy alszámos, egy dimenziós PENZ02 kötvállalást egyszerűen és rögzítetlenül feltölthessünk az adatbázisba?',
	]
	embeddings = model.encode(sentences)
	print(embeddings.shape)
	# [3, 1024]

	# Get the similarity scores for the embeddings
	similarities = model.similarity(embeddings, embeddings)
	print(similarities.shape)
	# [3, 3]
	```

	<!--
	### Direct Usage (Transformers)

	<details><summary>Click to see the direct usage in Transformers</summary>

	</details>
	-->

	<!--
	### Downstream Usage (Sentence Transformers)

	You can finetune this model on your own dataset.

	<details><summary>Click to expand</summary>

	</details>
	-->

	<!--
	### Out-of-Scope Use

	List how the model may foreseeably be misused and address what users ought not to do with the model.
	-->

	## Evaluation

	### Metrics

	#### Information Retrieval
	* Dataset: `BAAI/bge-m3`
	* Evaluated with [<code>InformationRetrievalEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.InformationRetrievalEvaluator)

	\| Metric \| Value \|
	\|:--------------------\|:-----------\|
	\| cosine_accuracy@1 \| 0.4482 \|
	\| cosine_accuracy@3 \| 0.6524 \|
	\| cosine_accuracy@5 \| 0.7302 \|
	\| cosine_accuracy@10 \| 0.8247 \|
	\| cosine_precision@1 \| 0.4482 \|
	\| cosine_precision@3 \| 0.2175 \|
	\| cosine_precision@5 \| 0.146 \|
	\| cosine_precision@10 \| 0.0825 \|
	\| cosine_recall@1 \| 0.4482 \|
	\| cosine_recall@3 \| 0.6524 \|
	\| cosine_recall@5 \| 0.7302 \|
	\| cosine_recall@10 \| 0.8247 \|
	\| cosine_ndcg@10 \| 0.6326 \|
	\| cosine_mrr@10 \| 0.5716 \|
	\| cosine_map@3 \| 0.5409 \|
	\| cosine_map@5 \| 0.5589 \|
	\| cosine_map@10 \| 0.5716 \|
	\| dot_accuracy@1 \| 0.4482 \|
	\| dot_accuracy@3 \| 0.6524 \|
	\| dot_accuracy@5 \| 0.7302 \|
	\| dot_accuracy@10 \| 0.8247 \|
	\| dot_precision@1 \| 0.4482 \|
	\| dot_precision@3 \| 0.2175 \|
	\| dot_precision@5 \| 0.146 \|
	\| dot_precision@10 \| 0.0825 \|
	\| dot_recall@1 \| 0.4482 \|
	\| dot_recall@3 \| 0.6524 \|
	\| dot_recall@5 \| 0.7302 \|
	\| dot_recall@10 \| 0.8247 \|
	\| dot_ndcg@10 \| 0.6326 \|
	\| dot_mrr@10 \| 0.5716 \|
	\| dot_map@3 \| 0.5409 \|
	\| dot_map@5 \| 0.5589 \|
	\| dot_map@10 \| 0.5716 \|

	<!--
	## Bias, Risks and Limitations

	What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.
	-->

	<!--
	### Recommendations

	What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.
	-->

	## Training Details

	### Training Dataset

	#### Unnamed Dataset


	* Size: 5,903 training samples
	* Columns: <code>positive</code> and <code>anchor</code>
	* Approximate statistics based on the first 1000 samples:
	\| \| positive \| anchor \|
	\|:--------\|:-------------------------------------------------------------------------------------\|:-----------------------------------------------------------------------------------\|
	\| type \| string \| string \|
	\| details \| <ul><li>min: 30 tokens</li><li>mean: 235.99 tokens</li><li>max: 503 tokens</li></ul> \| <ul><li>min: 12 tokens</li><li>mean: 33.9 tokens</li><li>max: 121 tokens</li></ul> \|
	* Samples:
	\| positive \| anchor \|
	\|:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------\|:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------\|
	\| <code>apján, majd fokozatosan a kiadások függvényében lecsökken. A bizonylatok rögzítéshez a környezet beállító panelen Naplót, Pénzügyi kartont és Bizonylati tömböt kell választani. A bizonylatok karbantartása a NAVIGÁCIÓ és KARBANTARTÓ képernyők Művelet menüjében található funkciókkal történik. 138 Az általános funkciókról bővebben: Törzsek és nyilvántartások általános kezelése 831 A bizonylattípus sajátos funkcióiról bővebben: Bank bizonylatok karbantartása 30 A KARBANTARTÓ adatmezőinek értelmezése részletesen: Pénzügyi bizonylatok nyilvántartása Banki kartonok A menüpontban lehetőségünk van egy-egy banki kartonhoz tartozó összes bizonylati sor folyamatos megtekintésére, azaz nem kell bizonylatonként a fej és sor ablakok között váltva lépegetni.</code> \| <code>Melyek azok a bizonylattípusok, amelyekhez az átutalás folyamata kiemelt funkciókkal rendelkezik?</code> \|
	\| <code>Ez az információ nem biztos, hogy megfelel a folyószámla információból kapott adatokkal, mert az csak a Z - Zárt és K - Könyvelt bizonylatokkal foglalkozik, a számla rendezési egyenlege viszont a banki tétel lerögzítésekor azonnal módosul. 212 Egy bizonylat hatására megjelenik a képernyőn a számla az Egy bizonylat megtekintése menüpontban ismertetett módon. Lekérdezés hatására az általános lekérdező indul, mellyel a pénzügyi bizonylatok tételeiről készíthetünk outputokat. Bizonylati tételek lekérdezése 62 A Pénzügyi bizonylatok SOR adatainak (psztetel) tábla lekérdezése az Általános lekérdező segítségével. Bizonylati fejek lekérdezése 30 A Pénzügyi bizonylatok FEJ adatainak (pszfej) tábla lekérdezése az Általános lekérdező segítségével. Egy bizonylat megtekintése A Forrásban rögzített, egy konkrét bizonylat képernyős megjelenítési lehetősége. Ez egyrészt az adott bizonylat megkeresésének egy gyorsabb módja, másrészt így olyan felhasználó is megtekintheti a bizonylatot, akinek egyébként</code> \| <code>Mi indokolhatja a számla rendezési egyenlegben észlelt változást, ha az nem jelenik meg a folyószámlán?</code> \|
	\| <code>y-e a felhasználó 'forras' rendszerparaméter értéke Költségvetési intézmény és a forkjl - Költségvetési intézmény jellege 'forras' rendszerparaméter értéke Fejezet. A fejezeti hatáskörrel rendelkező költségvetési intézményeknél, a külső megvalósító által bonyolított szerződések, kötelezettségvállalások pénzügyi bonyolításakor, a külső beruházónak címzett számlák bizonylati csoportjának a nyilvántartása. A számla nem a felhasználónak van címezve, hanem a külső beruházónak. Bizonylattípus: PENX01. A bizonylat fejben a Partner adatai (f_padat) mező kitöltése kötelező, ennek hiányában nem jelöli ki utalásra a számlát. Faktorált tartozás kivezetése Faktorált tartozás kivezetés bizonylatok nyilvántartása. Bizonylattípus: PENS16. A bizonylat rögzíthető vagy generatív úton (ajánlott) előállítható ebben a menüpontban. Mindkét művelethez a Környezet beállító panelen Naplót és Bizonylati tömböt kell választani. 30 A KARBANTARTÓ képernyő adatmezőinek értelmezését a Pénzügyi bizonylatok nyilvántart</code> \| <code>Miért szükséges külön menüpontot létrehozni a faktorált tartozás kivezetése és annak bizonylati nyilvántartása esetén, miközben ebben a menüpontban megjelenő pénzügyi bizonylatokat azonosítási szempontból megegyezik más pénzügyi bizonylatokkal?</code> \|
	* Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
	```json
	{
	"scale": 20.0,
	"similarity_fct": "cos_sim"
	}
	```

	### Training Hyperparameters
	#### Non-Default Hyperparameters

	- `eval_strategy`: epoch
	- `per_device_train_batch_size`: 16
	- `per_device_eval_batch_size`: 16
	- `gradient_accumulation_steps`: 16
	- `learning_rate`: 2e-05
	- `num_train_epochs`: 4
	- `lr_scheduler_type`: cosine
	- `warmup_ratio`: 0.1
	- `fp16`: True
	- `tf32`: False
	- `load_best_model_at_end`: True
	- `optim`: adamw_torch_fused
	- `batch_sampler`: no_duplicates

	#### All Hyperparameters
	<details><summary>Click to expand</summary>

	- `overwrite_output_dir`: False
	- `do_predict`: False
	- `eval_strategy`: epoch
	- `prediction_loss_only`: True
	- `per_device_train_batch_size`: 16
	- `per_device_eval_batch_size`: 16
	- `per_gpu_train_batch_size`: None
	- `per_gpu_eval_batch_size`: None
	- `gradient_accumulation_steps`: 16
	- `eval_accumulation_steps`: None
	- `torch_empty_cache_steps`: None
	- `learning_rate`: 2e-05
	- `weight_decay`: 0.0
	- `adam_beta1`: 0.9
	- `adam_beta2`: 0.999
	- `adam_epsilon`: 1e-08
	- `max_grad_norm`: 1.0
	- `num_train_epochs`: 4
	- `max_steps`: -1
	- `lr_scheduler_type`: cosine
	- `lr_scheduler_kwargs`: {}
	- `warmup_ratio`: 0.1
	- `warmup_steps`: 0
	- `log_level`: passive
	- `log_level_replica`: warning
	- `log_on_each_node`: True
	- `logging_nan_inf_filter`: True
	- `save_safetensors`: True
	- `save_on_each_node`: False
	- `save_only_model`: False
	- `restore_callback_states_from_checkpoint`: False
	- `no_cuda`: False
	- `use_cpu`: False
	- `use_mps_device`: False
	- `seed`: 42
	- `data_seed`: None
	- `jit_mode_eval`: False
	- `use_ipex`: False
	- `bf16`: False
	- `fp16`: True
	- `fp16_opt_level`: O1
	- `half_precision_backend`: auto
	- `bf16_full_eval`: False
	- `fp16_full_eval`: False
	- `tf32`: False
	- `local_rank`: 0
	- `ddp_backend`: None
	- `tpu_num_cores`: None
	- `tpu_metrics_debug`: False
	- `debug`: []
	- `dataloader_drop_last`: False
	- `dataloader_num_workers`: 0
	- `dataloader_prefetch_factor`: None
	- `past_index`: -1
	- `disable_tqdm`: False
	- `remove_unused_columns`: True
	- `label_names`: None
	- `load_best_model_at_end`: True
	- `ignore_data_skip`: False
	- `fsdp`: []
	- `fsdp_min_num_params`: 0
	- `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
	- `fsdp_transformer_layer_cls_to_wrap`: None
	- `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
	- `deepspeed`: None
	- `label_smoothing_factor`: 0.0
	- `optim`: adamw_torch_fused
	- `optim_args`: None
	- `adafactor`: False
	- `group_by_length`: False
	- `length_column_name`: length
	- `ddp_find_unused_parameters`: None
	- `ddp_bucket_cap_mb`: None
	- `ddp_broadcast_buffers`: False
	- `dataloader_pin_memory`: True
	- `dataloader_persistent_workers`: False
	- `skip_memory_metrics`: True
	- `use_legacy_prediction_loop`: False
	- `push_to_hub`: False
	- `resume_from_checkpoint`: None
	- `hub_model_id`: None
	- `hub_strategy`: every_save
	- `hub_private_repo`: False
	- `hub_always_push`: False
	- `gradient_checkpointing`: False
	- `gradient_checkpointing_kwargs`: None
	- `include_inputs_for_metrics`: False
	- `eval_do_concat_batches`: True
	- `fp16_backend`: auto
	- `push_to_hub_model_id`: None
	- `push_to_hub_organization`: None
	- `mp_parameters`:
	- `auto_find_batch_size`: False
	- `full_determinism`: False
	- `torchdynamo`: None
	- `ray_scope`: last
	- `ddp_timeout`: 1800
	- `torch_compile`: False
	- `torch_compile_backend`: None
	- `torch_compile_mode`: None
	- `dispatch_batches`: None
	- `split_batches`: None
	- `include_tokens_per_second`: False
	- `include_num_input_tokens_seen`: False
	- `neftune_noise_alpha`: None
	- `optim_target_modules`: None
	- `batch_eval_metrics`: False
	- `eval_on_start`: False
	- `eval_use_gather_object`: False
	- `batch_sampler`: no_duplicates
	- `multi_dataset_batch_sampler`: proportional

	</details>

	### Training Logs
	\| Epoch \| Step \| Training Loss \| BAAI/bge-m3_cosine_map@10 \|
	\|:----------:\|:------:\|:-------------:\|:-------------------------:\|
	\| 0 \| 0 \| - \| 0.4964 \|
	\| 0.4336 \| 10 \| 0.5948 \| - \|
	\| 0.8672 \| 20 \| 0.2898 \| - \|
	\| 0.9973 \| 23 \| - \| 0.5618 \|
	\| 1.3008 \| 30 \| 0.194 \| - \|
	\| 1.7344 \| 40 \| 0.1346 \| - \|
	\| 1.9946 \| 46 \| - \| 0.5784 \|
	\| 2.1680 \| 50 \| 0.1115 \| - \|
	\| 2.6016 \| 60 \| 0.0755 \| - \|
	\| 2.9919 \| 69 \| - \| 0.5735 \|
	\| 3.0352 \| 70 \| 0.0699 \| - \|
	\| 3.4688 \| 80 \| 0.0553 \| - \|
	\| 3.9024 \| 90 \| 0.0572 \| - \|
	\| 3.9892 \| 92 \| - \| 0.5716 \|

	* The bold row denotes the saved checkpoint.

	### Framework Versions
	- Python: 3.10.12
	- Sentence Transformers: 3.0.1
	- Transformers: 4.44.2
	- PyTorch: 2.4.0+cu121
	- Accelerate: 0.33.0
	- Datasets: 2.21.0
	- Tokenizers: 0.19.1

	## Citation

	### BibTeX

	#### Sentence Transformers
	```bibtex
	@inproceedings{reimers-2019-sentence-bert,
	title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
	author = "Reimers, Nils and Gurevych, Iryna",
	booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
	month = "11",
	year = "2019",
	publisher = "Association for Computational Linguistics",
	url = "https://arxiv.org/abs/1908.10084",
	}
	```

	#### MultipleNegativesRankingLoss
	```bibtex
	@misc{henderson2017efficient,
	title={Efficient Natural Language Response Suggestion for Smart Reply},
	author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
	year={2017},
	eprint={1705.00652},
	archivePrefix={arXiv},
	primaryClass={cs.CL}
	}
	```

	<!--
	## Glossary

	Clearly define terms in order to be accessible across audiences.
	-->

	<!--
	## Model Card Authors

	Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.
	-->

	<!--
	## Model Card Contact

	Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.
	-->