metadata
base_model: BAAI/bge-m3
datasets: []
language: []
library_name: sentence-transformers
metrics:
- cosine_accuracy@1
- cosine_accuracy@3
- cosine_accuracy@5
- cosine_accuracy@10
- cosine_precision@1
- cosine_precision@3
- cosine_precision@5
- cosine_precision@10
- cosine_recall@1
- cosine_recall@3
- cosine_recall@5
- cosine_recall@10
- cosine_ndcg@10
- cosine_mrr@10
- cosine_map@3
- cosine_map@5
- cosine_map@10
- dot_accuracy@1
- dot_accuracy@3
- dot_accuracy@5
- dot_accuracy@10
- dot_precision@1
- dot_precision@3
- dot_precision@5
- dot_precision@10
- dot_recall@1
- dot_recall@3
- dot_recall@5
- dot_recall@10
- dot_ndcg@10
- dot_mrr@10
- dot_map@3
- dot_map@5
- dot_map@10
pipeline_tag: sentence-similarity
tags:
- sentence-transformers
- sentence-similarity
- feature-extraction
- generated_from_trainer
- dataset_size:5903
- loss:MultipleNegativesRankingLoss
widget:
- source_sentence: >-
fldhelyével és tipusa:U. Arra a tételre kell ráállni, amelyik kivezetés
bizonylatát és átadott eszközét át akarjuk venni. Eszköz válogatás-ra
kattintva a kivezetés (átadás) bizonylat tételeiből lehet szelektálni.
Amennyiben az Eszköz válogatással nem szelektálunk, az átadó bizonylaton
szereplő valamennyi eszköz átvételre kerül. Az időszak, a beléptető
fldhely,az átvevő bizonylat dátuma megegyezik az átadó bizonylat
időszakával és dátumával. Megadandó: · Új kezelő eek, · Új szervezeti
egység (eek nem kötelező) · Átvétel bizonylati tömb (KESXE01) egyéb
növekedés · Átvétel mozgásnem (KESXE01) egyéb növekedés · Bizonylat
nyomtatás (I/N) · Új tárhely adatok: Nem/Igen - Igen esetén: Tárolási
hely leltárkörzet: A [kescti] - Cím adatok tároló ingatlan alapján?
készlet alrendszer paraméter : Igen értéke esetén: Ha a Leltárkörzet
törzsben hozzá van rendelve a megfelelő tároló ingatlan akkor rögzítésekor
a tároló ingatlan és a hozzá tartozó cím adatok is bejegyzésre kerülnek.
Itt értékük már nem
sentences:
- >-
Miért kéri az alkalmazás megjeleníteni a kontírozott folyószámlaszámot
és árbevételi számlát a szerződésben ha a jogcím törzs második oldala
nyilvántartási számla és elsődleges ellenszámla mezőiben szereplő
folyószámlaszámok és árbevételi számlák egyeznek meg a szerződésben
megjelölt számlaszámokkal?
- >-
Melyek a feltételek, amelyek alapján az online adatszolgáltatás
előkészítő programja tölt fel adattal az eredeti számla legutóbbi
módosító okiratának sorszámát?
- >-
Mi a célja az eszközök átvételével kapcsolatos új kezelők
regisztrálásának és az új szervezeti egység létrehozásának, amikor
egyeztetni kell az átadó és átvevő bizonylatokat?
- source_sentence: >-
(A Szerver oldali dll használat? [csharp] rendszerparaméter értéke
alapértelmezéstől eltérő 1, Igen esetén, ha a Külső bizonylatszámot a
felhasználó FST funkcióval felüldefiniálja, akkor az FST-ben definiált
maximális hossz alapján töltjük a külső bizonylatszámot.) Partnerkód
(szárm.) - f_partner PARTNER törzskapcsolat Az eszközt szállító/értékesítő
partner azonosító kódja. ÉJ (Építményjegyzék) szám - f_ej ESZEJ
törzskapcsolat Az építmények építményjegyzék szerinti besorolását lehet
rögzíteni a hatályos építményjegyzéknek megfelelően. Kezelő elszámolási
egység / Kezelő szervezeti egység - f_keek EGYSEG törzskapcsolat
Amennyiben az Elszámolási egység törzsben a Státusz, a Nyitás dátuma és a
Zárás dátuma mezők használatban vannak, az alábbi feltételek teljesülése
esetén választhatók ki: 1. a kód státusza Nyitott és a Nyitás dátuma üres
vagy nem nagyobb, mint a viszonyítási dátum (aktuális dátum) VAGY 2. a kód
státusza Nyitott és a Zárás dátuma nagyobb, mint a viszonyítási dátum
(aktuális
sentences:
- >-
Milyen hatással bír az a szituáció, amikor az építményjegyzék (ÉJ) szám
nem egyezik meg a FST-ben definiált maximális hossz alapján töltött
külső bizonylatszámmal?
- >-
Miért történik meg a KT02- bizonylat generálása csak akkor, ha nem adunk
meg alszámot?
- >-
Hogyan ellenőrizhetem, hogy véletlenül megsemmisítettem-e a főkönyvi
naplómat?
- source_sentence: >-
nyezhetők. Itt célszerű vagy előre FST/FJK szűrést beállítani vagy a
navigáció tölcsér funkciójával szűrést beállítani, hogy csak a
bejelentkezett felhasználó aláírására váró számlák jelenjenek meg.
Iktatókönyv kijelölése után aktív a Karbantartás funkció, az aláírandó
számlán indítva megjelenik a számla fej karbantartó.
sentences:
- >-
Mi a bruttó végösszeg, ha 20%-os adót kell befizetni egy olyan számlán,
amelyhez hozzáadott értékkel megjelölt termékeket forgalmaztak?
- >-
Milyen kritériumok alapján lesznek meghatározva az összes bejegyzés
lehetséges típusai a számlákhoz kapcsolódó értékeknél?
- >-
Miért lenne fontos a navigációs tölcsér funkció használata ahhoz, hogy
csak a bejelentkezett felhasználó aláírására váró számlák jelenjenek meg
az iktatókönyvben?
- source_sentence: >-
y számla akkor eshet így ki a generálásból, ha a dátumai alapján a
megadott ÁFA-időszaknál későbbi lesz a megállapított ÁFA-időszaka. Ezekre
a számlákra majd a következő vagy azután következő hónapban kerül sor.
(Ezek lehetnek a 4 eset közül a 3. és 4. eset.) Könyvelési napló: az
ÁFA-telj.dátumnak megfelelő N - Nyitott, pénzügyi napló, amibe az ÁFA-
rendező bizonylatot generálja a program. Generálás hatására megerősítendő
kérdést tesz fel: Igen hatására bekéri az ÁFA-rendező bizonylat
előállításához szükséges adatokat: SZÁLLÍTÓ
sentences:
- >-
Mi lesz a következő lépés, ha a feldolgozási dátum után egy hónappal
kiadott számla ÁFA-időszaka túllép a 3-4 hónapos időtartamon?
- >-
Milyen folyamatot követ el az alkalmazás, ha a Számlakép fájlformátuma
mezőben PDF szerepel és küldéskor átkonvertálja?
- >-
Mi az oka annak, hogy a program korlátozza az újrakontírozást azokra a
kartonokra, amelyeken még nincs könyvelt bruttó és/vagy ÉCS sora?
- source_sentence: >-
§ Adóalap összege (könyvelt): nettó adóalap § ÁFA összege (könyvelt):
nettó áfa § Adóalap összege (ÁFA árf) § ÁFA összege (ÁFA árf) Az ÁFA
árfolyamos adóalap és ÁFA oszlopokba az adott sorban eltárolt
ÁFA-árfolyammal kiszámított összegek kerülnek, így az ÁFA árfolyamos
forint alap és a forint ÁFA százalékosan megfelel egymásnak. Egy
közösségi, 45 napos listázásánál ez a két összeg megegyezik, mivel a 45
napos bizonylat ugyanezzel az árfolyammal lett forintosítva. Hogy jó
ÁFA-árfolyammal számoljon a program, célszerű az Utólagos forintosítás
funkció elindítani a bizonylatokra. Az ÁFA-rendező bizonylatokon a
mennyiségi egység és mennyiség informatíve tartalmazhatja a nettó
összeget, ha azt egyébként a nettó mezőben nem szerepeltetjük. Ezeket a
mezőket az EU-ÁFA-rendező, a Fordított adózás, a mínuszos számlákhoz, az
eltérő teljesítési idejű számlákhoz, valamint a Felvásárlási jegyekhez
történő ÁFA-rendező bizonylatok generálása is feltölti, valamint a
bizonylatok kézi rögzítésénél is tölt
sentences:
- >-
Miért létezik a lehetőség, hogy egy alszámos, egy dimenziós PENZ02
kötvállalást egyszerűen és rögzítetlenül feltölthessünk az adatbázisba?
- >-
Mi lesz a hatása annak, ha bekapcsoljuk a raktári és főkönyvi mennyiség
megadását a készletmozgások bizonylatolásakor?
- >-
Miért szükséges az adóalap és az áfa összege megfelelőnek lennie egy 45
napos listázásnál?
model-index:
- name: SentenceTransformer based on BAAI/bge-m3
results:
- task:
type: information-retrieval
name: Information Retrieval
dataset:
name: BAAI/bge m3
type: BAAI/bge-m3
metrics:
- type: cosine_accuracy@1
value: 0.4481707317073171
name: Cosine Accuracy@1
- type: cosine_accuracy@3
value: 0.6524390243902439
name: Cosine Accuracy@3
- type: cosine_accuracy@5
value: 0.7301829268292683
name: Cosine Accuracy@5
- type: cosine_accuracy@10
value: 0.8246951219512195
name: Cosine Accuracy@10
- type: cosine_precision@1
value: 0.4481707317073171
name: Cosine Precision@1
- type: cosine_precision@3
value: 0.21747967479674796
name: Cosine Precision@3
- type: cosine_precision@5
value: 0.14603658536585362
name: Cosine Precision@5
- type: cosine_precision@10
value: 0.08246951219512194
name: Cosine Precision@10
- type: cosine_recall@1
value: 0.4481707317073171
name: Cosine Recall@1
- type: cosine_recall@3
value: 0.6524390243902439
name: Cosine Recall@3
- type: cosine_recall@5
value: 0.7301829268292683
name: Cosine Recall@5
- type: cosine_recall@10
value: 0.8246951219512195
name: Cosine Recall@10
- type: cosine_ndcg@10
value: 0.6325741777762836
name: Cosine Ndcg@10
- type: cosine_mrr@10
value: 0.5716384775454897
name: Cosine Mrr@10
- type: cosine_map@3
value: 0.5409044715447155
name: Cosine Map@3
- type: cosine_map@5
value: 0.5588922764227642
name: Cosine Map@5
- type: cosine_map@10
value: 0.5716384775454898
name: Cosine Map@10
- type: dot_accuracy@1
value: 0.4481707317073171
name: Dot Accuracy@1
- type: dot_accuracy@3
value: 0.6524390243902439
name: Dot Accuracy@3
- type: dot_accuracy@5
value: 0.7301829268292683
name: Dot Accuracy@5
- type: dot_accuracy@10
value: 0.8246951219512195
name: Dot Accuracy@10
- type: dot_precision@1
value: 0.4481707317073171
name: Dot Precision@1
- type: dot_precision@3
value: 0.21747967479674796
name: Dot Precision@3
- type: dot_precision@5
value: 0.14603658536585362
name: Dot Precision@5
- type: dot_precision@10
value: 0.08246951219512194
name: Dot Precision@10
- type: dot_recall@1
value: 0.4481707317073171
name: Dot Recall@1
- type: dot_recall@3
value: 0.6524390243902439
name: Dot Recall@3
- type: dot_recall@5
value: 0.7301829268292683
name: Dot Recall@5
- type: dot_recall@10
value: 0.8246951219512195
name: Dot Recall@10
- type: dot_ndcg@10
value: 0.6325741777762836
name: Dot Ndcg@10
- type: dot_mrr@10
value: 0.5716384775454897
name: Dot Mrr@10
- type: dot_map@3
value: 0.5409044715447155
name: Dot Map@3
- type: dot_map@5
value: 0.5588922764227642
name: Dot Map@5
- type: dot_map@10
value: 0.5716384775454898
name: Dot Map@10
SentenceTransformer based on BAAI/bge-m3
This is a sentence-transformers model finetuned from BAAI/bge-m3. It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
Model Details
Model Description
- Model Type: Sentence Transformer
- Base model: BAAI/bge-m3
- Maximum Sequence Length: 8192 tokens
- Output Dimensionality: 1024 tokens
- Similarity Function: Cosine Similarity
Model Sources
- Documentation: Sentence Transformers Documentation
- Repository: Sentence Transformers on GitHub
- Hugging Face: Sentence Transformers on Hugging Face
Full Model Architecture
SentenceTransformer(
(0): Transformer({'max_seq_length': 8192, 'do_lower_case': False}) with Transformer model: XLMRobertaModel
(1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': True, 'pooling_mode_mean_tokens': False, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
(2): Normalize()
)
Usage
Direct Usage (Sentence Transformers)
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("cimi86/bge-m3-griffai-finetuned")
# Run inference
sentences = [
'§ Adóalap összege (könyvelt): nettó adóalap § ÁFA összege (könyvelt): nettó áfa § Adóalap összege (ÁFA árf) § ÁFA összege (ÁFA árf) Az ÁFA árfolyamos adóalap és ÁFA oszlopokba az adott sorban eltárolt ÁFA-árfolyammal kiszámított összegek kerülnek, így az ÁFA árfolyamos forint alap és a forint ÁFA százalékosan megfelel egymásnak. Egy közösségi, 45 napos listázásánál ez a két összeg megegyezik, mivel a 45 napos bizonylat ugyanezzel az árfolyammal lett forintosítva. Hogy jó ÁFA-árfolyammal számoljon a program, célszerű az Utólagos forintosítás funkció elindítani a bizonylatokra. Az ÁFA-rendező bizonylatokon a mennyiségi egység és mennyiség informatíve tartalmazhatja a nettó összeget, ha azt egyébként a nettó mezőben nem szerepeltetjük. Ezeket a mezőket az EU-ÁFA-rendező, a Fordított adózás, a mínuszos számlákhoz, az eltérő teljesítési idejű számlákhoz, valamint a Felvásárlási jegyekhez történő ÁFA-rendező bizonylatok generálása is feltölti, valamint a bizonylatok kézi rögzítésénél is tölt',
'Miért szükséges az adóalap és az áfa összege megfelelőnek lennie egy 45 napos listázásnál?',
'Miért létezik a lehetőség, hogy egy alszámos, egy dimenziós PENZ02 kötvállalást egyszerűen és rögzítetlenül feltölthessünk az adatbázisba?',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 1024]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
Evaluation
Metrics
Information Retrieval
- Dataset:
BAAI/bge-m3
- Evaluated with
InformationRetrievalEvaluator
Metric | Value |
---|---|
cosine_accuracy@1 | 0.4482 |
cosine_accuracy@3 | 0.6524 |
cosine_accuracy@5 | 0.7302 |
cosine_accuracy@10 | 0.8247 |
cosine_precision@1 | 0.4482 |
cosine_precision@3 | 0.2175 |
cosine_precision@5 | 0.146 |
cosine_precision@10 | 0.0825 |
cosine_recall@1 | 0.4482 |
cosine_recall@3 | 0.6524 |
cosine_recall@5 | 0.7302 |
cosine_recall@10 | 0.8247 |
cosine_ndcg@10 | 0.6326 |
cosine_mrr@10 | 0.5716 |
cosine_map@3 | 0.5409 |
cosine_map@5 | 0.5589 |
cosine_map@10 | 0.5716 |
dot_accuracy@1 | 0.4482 |
dot_accuracy@3 | 0.6524 |
dot_accuracy@5 | 0.7302 |
dot_accuracy@10 | 0.8247 |
dot_precision@1 | 0.4482 |
dot_precision@3 | 0.2175 |
dot_precision@5 | 0.146 |
dot_precision@10 | 0.0825 |
dot_recall@1 | 0.4482 |
dot_recall@3 | 0.6524 |
dot_recall@5 | 0.7302 |
dot_recall@10 | 0.8247 |
dot_ndcg@10 | 0.6326 |
dot_mrr@10 | 0.5716 |
dot_map@3 | 0.5409 |
dot_map@5 | 0.5589 |
dot_map@10 | 0.5716 |
Training Details
Training Dataset
Unnamed Dataset
- Size: 5,903 training samples
- Columns:
positive
andanchor
- Approximate statistics based on the first 1000 samples:
positive anchor type string string details - min: 30 tokens
- mean: 235.99 tokens
- max: 503 tokens
- min: 12 tokens
- mean: 33.9 tokens
- max: 121 tokens
- Samples:
positive anchor apján, majd fokozatosan a kiadások függvényében lecsökken. A bizonylatok rögzítéshez a környezet beállító panelen Naplót, Pénzügyi kartont és Bizonylati tömböt kell választani. A bizonylatok karbantartása a NAVIGÁCIÓ és KARBANTARTÓ képernyők Művelet menüjében található funkciókkal történik. 138 Az általános funkciókról bővebben: Törzsek és nyilvántartások általános kezelése 831 A bizonylattípus sajátos funkcióiról bővebben: Bank bizonylatok karbantartása 30 A KARBANTARTÓ adatmezőinek értelmezése részletesen: Pénzügyi bizonylatok nyilvántartása Banki kartonok A menüpontban lehetőségünk van egy-egy banki kartonhoz tartozó összes bizonylati sor folyamatos megtekintésére, azaz nem kell bizonylatonként a fej és sor ablakok között váltva lépegetni.
Melyek azok a bizonylattípusok, amelyekhez az átutalás folyamata kiemelt funkciókkal rendelkezik?
Ez az információ nem biztos, hogy megfelel a folyószámla információból kapott adatokkal, mert az csak a Z - Zárt és K - Könyvelt bizonylatokkal foglalkozik, a számla rendezési egyenlege viszont a banki tétel lerögzítésekor azonnal módosul. 212 Egy bizonylat hatására megjelenik a képernyőn a számla az Egy bizonylat megtekintése menüpontban ismertetett módon. Lekérdezés hatására az általános lekérdező indul, mellyel a pénzügyi bizonylatok tételeiről készíthetünk outputokat. Bizonylati tételek lekérdezése 62 A Pénzügyi bizonylatok SOR adatainak (psztetel) tábla lekérdezése az Általános lekérdező segítségével. Bizonylati fejek lekérdezése 30 A Pénzügyi bizonylatok FEJ adatainak (pszfej) tábla lekérdezése az Általános lekérdező segítségével. Egy bizonylat megtekintése A Forrásban rögzített, egy konkrét bizonylat képernyős megjelenítési lehetősége. Ez egyrészt az adott bizonylat megkeresésének egy gyorsabb módja, másrészt így olyan felhasználó is megtekintheti a bizonylatot, akinek egyébként
Mi indokolhatja a számla rendezési egyenlegben észlelt változást, ha az nem jelenik meg a folyószámlán?
y-e a felhasználó 'forras' rendszerparaméter értéke Költségvetési intézmény és a forkjl - Költségvetési intézmény jellege 'forras' rendszerparaméter értéke Fejezet. A fejezeti hatáskörrel rendelkező költségvetési intézményeknél, a külső megvalósító által bonyolított szerződések, kötelezettségvállalások pénzügyi bonyolításakor, a külső beruházónak címzett számlák bizonylati csoportjának a nyilvántartása. A számla nem a felhasználónak van címezve, hanem a külső beruházónak. Bizonylattípus: PENX01. A bizonylat fejben a Partner adatai (f_padat) mező kitöltése kötelező, ennek hiányában nem jelöli ki utalásra a számlát. Faktorált tartozás kivezetése Faktorált tartozás kivezetés bizonylatok nyilvántartása. Bizonylattípus: PENS16. A bizonylat rögzíthető vagy generatív úton (ajánlott) előállítható ebben a menüpontban. Mindkét művelethez a Környezet beállító panelen Naplót és Bizonylati tömböt kell választani. 30 A KARBANTARTÓ képernyő adatmezőinek értelmezését a Pénzügyi bizonylatok nyilvántart
Miért szükséges külön menüpontot létrehozni a faktorált tartozás kivezetése és annak bizonylati nyilvántartása esetén, miközben ebben a menüpontban megjelenő pénzügyi bizonylatokat azonosítási szempontból megegyezik más pénzügyi bizonylatokkal?
- Loss:
MultipleNegativesRankingLoss
with these parameters:{ "scale": 20.0, "similarity_fct": "cos_sim" }
Training Hyperparameters
Non-Default Hyperparameters
eval_strategy
: epochper_device_train_batch_size
: 16per_device_eval_batch_size
: 16gradient_accumulation_steps
: 16learning_rate
: 2e-05num_train_epochs
: 4lr_scheduler_type
: cosinewarmup_ratio
: 0.1fp16
: Truetf32
: Falseload_best_model_at_end
: Trueoptim
: adamw_torch_fusedbatch_sampler
: no_duplicates
All Hyperparameters
Click to expand
overwrite_output_dir
: Falsedo_predict
: Falseeval_strategy
: epochprediction_loss_only
: Trueper_device_train_batch_size
: 16per_device_eval_batch_size
: 16per_gpu_train_batch_size
: Noneper_gpu_eval_batch_size
: Nonegradient_accumulation_steps
: 16eval_accumulation_steps
: Nonetorch_empty_cache_steps
: Nonelearning_rate
: 2e-05weight_decay
: 0.0adam_beta1
: 0.9adam_beta2
: 0.999adam_epsilon
: 1e-08max_grad_norm
: 1.0num_train_epochs
: 4max_steps
: -1lr_scheduler_type
: cosinelr_scheduler_kwargs
: {}warmup_ratio
: 0.1warmup_steps
: 0log_level
: passivelog_level_replica
: warninglog_on_each_node
: Truelogging_nan_inf_filter
: Truesave_safetensors
: Truesave_on_each_node
: Falsesave_only_model
: Falserestore_callback_states_from_checkpoint
: Falseno_cuda
: Falseuse_cpu
: Falseuse_mps_device
: Falseseed
: 42data_seed
: Nonejit_mode_eval
: Falseuse_ipex
: Falsebf16
: Falsefp16
: Truefp16_opt_level
: O1half_precision_backend
: autobf16_full_eval
: Falsefp16_full_eval
: Falsetf32
: Falselocal_rank
: 0ddp_backend
: Nonetpu_num_cores
: Nonetpu_metrics_debug
: Falsedebug
: []dataloader_drop_last
: Falsedataloader_num_workers
: 0dataloader_prefetch_factor
: Nonepast_index
: -1disable_tqdm
: Falseremove_unused_columns
: Truelabel_names
: Noneload_best_model_at_end
: Trueignore_data_skip
: Falsefsdp
: []fsdp_min_num_params
: 0fsdp_config
: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}fsdp_transformer_layer_cls_to_wrap
: Noneaccelerator_config
: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}deepspeed
: Nonelabel_smoothing_factor
: 0.0optim
: adamw_torch_fusedoptim_args
: Noneadafactor
: Falsegroup_by_length
: Falselength_column_name
: lengthddp_find_unused_parameters
: Noneddp_bucket_cap_mb
: Noneddp_broadcast_buffers
: Falsedataloader_pin_memory
: Truedataloader_persistent_workers
: Falseskip_memory_metrics
: Trueuse_legacy_prediction_loop
: Falsepush_to_hub
: Falseresume_from_checkpoint
: Nonehub_model_id
: Nonehub_strategy
: every_savehub_private_repo
: Falsehub_always_push
: Falsegradient_checkpointing
: Falsegradient_checkpointing_kwargs
: Noneinclude_inputs_for_metrics
: Falseeval_do_concat_batches
: Truefp16_backend
: autopush_to_hub_model_id
: Nonepush_to_hub_organization
: Nonemp_parameters
:auto_find_batch_size
: Falsefull_determinism
: Falsetorchdynamo
: Noneray_scope
: lastddp_timeout
: 1800torch_compile
: Falsetorch_compile_backend
: Nonetorch_compile_mode
: Nonedispatch_batches
: Nonesplit_batches
: Noneinclude_tokens_per_second
: Falseinclude_num_input_tokens_seen
: Falseneftune_noise_alpha
: Noneoptim_target_modules
: Nonebatch_eval_metrics
: Falseeval_on_start
: Falseeval_use_gather_object
: Falsebatch_sampler
: no_duplicatesmulti_dataset_batch_sampler
: proportional
Training Logs
Epoch | Step | Training Loss | BAAI/bge-m3_cosine_map@10 |
---|---|---|---|
0 | 0 | - | 0.4964 |
0.4336 | 10 | 0.5948 | - |
0.8672 | 20 | 0.2898 | - |
0.9973 | 23 | - | 0.5618 |
1.3008 | 30 | 0.194 | - |
1.7344 | 40 | 0.1346 | - |
1.9946 | 46 | - | 0.5784 |
2.1680 | 50 | 0.1115 | - |
2.6016 | 60 | 0.0755 | - |
2.9919 | 69 | - | 0.5735 |
3.0352 | 70 | 0.0699 | - |
3.4688 | 80 | 0.0553 | - |
3.9024 | 90 | 0.0572 | - |
3.9892 | 92 | - | 0.5716 |
- The bold row denotes the saved checkpoint.
Framework Versions
- Python: 3.10.12
- Sentence Transformers: 3.0.1
- Transformers: 4.44.2
- PyTorch: 2.4.0+cu121
- Accelerate: 0.33.0
- Datasets: 2.21.0
- Tokenizers: 0.19.1
Citation
BibTeX
Sentence Transformers
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
MultipleNegativesRankingLoss
@misc{henderson2017efficient,
title={Efficient Natural Language Response Suggestion for Smart Reply},
author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
year={2017},
eprint={1705.00652},
archivePrefix={arXiv},
primaryClass={cs.CL}
}