Add new SentenceTransformer model.
Browse files- .gitattributes +2 -0
- 1_Pooling/config.json +10 -0
- README.md +565 -0
- config.json +26 -0
- config_sentence_transformers.json +10 -0
- model.safetensors +3 -0
- modules.json +14 -0
- sentence_bert_config.json +4 -0
- special_tokens_map.json +51 -0
- tokenizer.json +3 -0
- tokenizer_config.json +64 -0
- unigram.json +3 -0
.gitattributes
CHANGED
@@ -33,3 +33,5 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
|
|
33 |
*.zip filter=lfs diff=lfs merge=lfs -text
|
34 |
*.zst filter=lfs diff=lfs merge=lfs -text
|
35 |
*tfevents* filter=lfs diff=lfs merge=lfs -text
|
|
|
|
|
|
33 |
*.zip filter=lfs diff=lfs merge=lfs -text
|
34 |
*.zst filter=lfs diff=lfs merge=lfs -text
|
35 |
*tfevents* filter=lfs diff=lfs merge=lfs -text
|
36 |
+
tokenizer.json filter=lfs diff=lfs merge=lfs -text
|
37 |
+
unigram.json filter=lfs diff=lfs merge=lfs -text
|
1_Pooling/config.json
ADDED
@@ -0,0 +1,10 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"word_embedding_dimension": 384,
|
3 |
+
"pooling_mode_cls_token": false,
|
4 |
+
"pooling_mode_mean_tokens": true,
|
5 |
+
"pooling_mode_max_tokens": false,
|
6 |
+
"pooling_mode_mean_sqrt_len_tokens": false,
|
7 |
+
"pooling_mode_weightedmean_tokens": false,
|
8 |
+
"pooling_mode_lasttoken": false,
|
9 |
+
"include_prompt": true
|
10 |
+
}
|
README.md
ADDED
@@ -0,0 +1,565 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
---
|
2 |
+
base_model: Mykes/med-MiniLM-L12-3059
|
3 |
+
datasets: []
|
4 |
+
language: []
|
5 |
+
library_name: sentence-transformers
|
6 |
+
pipeline_tag: sentence-similarity
|
7 |
+
tags:
|
8 |
+
- sentence-transformers
|
9 |
+
- sentence-similarity
|
10 |
+
- feature-extraction
|
11 |
+
- generated_from_trainer
|
12 |
+
- dataset_size:3299
|
13 |
+
- loss:MultipleNegativesRankingLoss
|
14 |
+
widget:
|
15 |
+
- source_sentence: Мне поставили диагноз псориаз. Какой препарат мне может помочь
|
16 |
+
справиться с этим заболеванием? Какие побочные эффекты могут быть у этого препарата?
|
17 |
+
Я слышала о препарате **Ксеомин**, он подходит для лечения псориаза?
|
18 |
+
sentences:
|
19 |
+
- 'краснова ирина викторовна; стоимость приема от: 2870 руб (средняя стоимость приема);
|
20 |
+
стаж: 15 лет; тип приёма: в клинике; клиника: медцентр столица на арбате; смоленская,
|
21 |
+
кропоткинская; специальность: венеролог, дерматолог, косметолог, онкодерматолог;
|
22 |
+
специализация: крапивница, розацеа, экзема, себорейный дерматит, папилломы, криодеструкцией
|
23 |
+
контурная пластика лица препаратами на основе гиалуроновой кислоты киоревитализация
|
24 |
+
кожи лица мезотерапия коррекция мимических морщин ботокс, заболеваний кожи, атопический
|
25 |
+
дерматит, угревая болезнь, бородавки, кератомы аппаратом сургитрон, микозы, ксеомин,
|
26 |
+
фотек, бактериальные и вирусные заболевания дерматоскопия новообразований кожи
|
27 |
+
трихоскопия удаление новообразований кожи невусы, лантокс химические пилинги поверхностного
|
28 |
+
и срединного действия, волос и ногтей псориаз'
|
29 |
+
- 'кошелева евгения николаевна; стоимость приема от: 4300 руб (средняя стоимость
|
30 |
+
приема); стаж: 15 лет; квалификация: врач высшей категории; учёная степень: кандидат
|
31 |
+
медицинских наук; пациенты: взрослые; тип приёма: в клинике; клиника: клинико-диагностический
|
32 |
+
центр медси в грохольском переулке; сухаревская, проспект мира; специальность:
|
33 |
+
гастроэнтеролог, терапевт; специализация: хронический гастродуоденит хронический
|
34 |
+
холецистит хронический панкреатит гепатит синдром раздраженного кишечника дискинезия
|
35 |
+
толстого кишечника гипертоническая болезнь ишемическая болезнь сердца стенокардия
|
36 |
+
напряжения хроническая сердечная недостаточность острый и хронический бронхит
|
37 |
+
пневмония орви хроническая анемия лихорадка неясного генеза синдром ускоренного
|
38 |
+
соэ'
|
39 |
+
- 'головкин владимир николаевич; стоимость приема от: 1080 руб (низкая стоимость
|
40 |
+
приема); стаж: 20 лет; квалификация: врач высшей категории; пациенты: взрослые;
|
41 |
+
тип приёма: в клинике; лермонтовский проспект, улица 1905 года, цска, косино,
|
42 |
+
беговая, ухтомская; специальность: ортопед, вертебролог, травматолог, артролог;
|
43 |
+
специализация: в том числе посттравматического артроза, энтеропатической артропатии,
|
44 |
+
инфекционного и реактивного артритов, подагрического артрита и тд владеет следующими
|
45 |
+
методиками, на дифференциальной диагностике и лечении заболеваний опорнодвигательного
|
46 |
+
аппарата'
|
47 |
+
- source_sentence: У меня сильный запор уже несколько дней. Какие обследования мне
|
48 |
+
нужно пройти, чтобы понять причину? Можете ли вы порекомендовать какие-нибудь
|
49 |
+
препараты от запора?
|
50 |
+
sentences:
|
51 |
+
- 'салахутдинова альмира рамилевна; стоимость приема от: 3000 руб (средняя стоимость
|
52 |
+
приема); стаж: 5 лет; пациенты: взрослые; тип приёма: в клинике; клиника: клиника
|
53 |
+
temed (темед) на фонвизинской; останкино, фонвизинская, петровско-разумовская;
|
54 |
+
специальность: невролог, вертебролог; специализация: парез нижних конечностей,
|
55 |
+
спины головные боли, грыжа позвоночника поясничного отдела, грыжа шморля, защемление
|
56 |
+
грыжи позвоночника, дорзальная грыжа, секвестрированная грыжа позвоночника поясничного
|
57 |
+
отдела, грыжа позвоночника, позвоночника, грыжа шейного отдела позвоночника, остеохондроз
|
58 |
+
поясничный, остеохондроз крестцовый, секвестрированная грыжа позвоночника, межпозвоночная
|
59 |
+
грыжа поясничнокрестцового отдела позвоночника, остеохондроз, мигрень и головокружения
|
60 |
+
заболевания внутренних органов мышечный гипертонус остеохондроз позвоночника плечелопаточные
|
61 |
+
периартриты радикулит специализируется на лечении вертебролог грыжа, обострение
|
62 |
+
грыжи поясничного отдела, грыжа шморля поясничного отдела позвоночника, радикулит,
|
63 |
+
спинномозговая грыжа невролог грыжа, грыжа между 4 и 5 позвонком, боли в области
|
64 |
+
суставов, остеохондроз позвоночника у взрослых'
|
65 |
+
- 'герасименко владимир витальевич; стоимость приема от: 3000 руб (средняя стоимость
|
66 |
+
приема); стаж: 29 лет; квалификация: врач высшей категории; учёная степень: кандидат
|
67 |
+
медицинских наук; пациенты: взрослые; тип приёма: в клинике; клиника: plasmolifting
|
68 |
+
praxis (плазмолифтинг праксис); пролетарская, римская, крестьянская застава; специальность:
|
69 |
+
нейрохирург, невролог, вертебролог; специализация: лицевая боли мигрени, последствия
|
70 |
+
травм спины и головы болезнь альцгеймера вегетососудистая дистония болезнь паркинсона
|
71 |
+
и тд занимается лечением таких проблем, головная, нарушение сознания боли в области
|
72 |
+
спины грыжевые образования, остеохондроз и т д инсульт и его последствия травмы,
|
73 |
+
радикулит, параличи белла и др судорожные состояния, нервные тики, эпилептические
|
74 |
+
припадки, дрожания'
|
75 |
+
- 'белихина наталья николаевна; стаж: 20 лет; специальность: гастроэнтеролог; пациенты:
|
76 |
+
взрослые; тип приёма: в клинике; клиника: будь здоров на сухаревской; сухаревская,
|
77 |
+
сретенский бульвар, трубная; специализация: запор, гепатит, заболевания желудочнокишечного
|
78 |
+
тракта, дисбактериоз, панкреатит, эзофагит, язва двенадцатиперстной кишки, язва
|
79 |
+
желудка, холецистит, гастрит язва желудка и двенадцатиперстной кишки дисбактериоз
|
80 |
+
гепатит диарея понос панкреатит холецистит эзофагит колит запор специализируется
|
81 |
+
на лечении гастроэнтеролог гастрит, диарея'
|
82 |
+
- source_sentence: У меня уже неделю сильные боли в правом подреберье. Могла ли причиной
|
83 |
+
стать жирная пища? Какие обследования мне нужно пройти для выявления причины болей?
|
84 |
+
sentences:
|
85 |
+
- 'мартыненко дарья марковна; стоимость приема от: 2530 руб (средняя стоимость приема);
|
86 |
+
стаж: 3 года; тип приёма: в клинике; клиника: uniклиник (юниклиник); бибирево,
|
87 |
+
алтуфьево; специальность: венеролог, дерматолог, дерматовенеролог; специализация:
|
88 |
+
экзема и аллергические дерматиты, инфекционные и неинфекционные заболевания кожи
|
89 |
+
и её придатков ногтей и волос диагностика и удаление различных новообразований
|
90 |
+
на коже диагностика и лечение заболеваний кожи и транзиторных состояний у детей
|
91 |
+
грудного и старшего возрастов атопический дерматит, акне'
|
92 |
+
- 'попов михаил сергеевич; стоимость приема от: 3000 руб (средняя стоимость приема);
|
93 |
+
стаж: 5 лет; пациенты: взрослые; тип приёма: в клинике; клиника: скриндоктор;
|
94 |
+
добрынинская, серпуховская, шаболовская; специальность: венеролог, дерматолог,
|
95 |
+
дерматовенеролог; специализация: контактный, герпес микозов грибковых заболеваний
|
96 |
+
кожи специализируется на лечении дерматолог алопеция тотальная, родинки, псориаз,
|
97 |
+
красные родинки, лишаи различных типов псориаз дерматит аллергический, витилиго,
|
98 |
+
нейродермит акне угрей экзема розацеа себорея вирусных заболеваний кожи паппиломы,
|
99 |
+
бородавки, дерматит, атопический'
|
100 |
+
- 'таргаков вадим даулетович; стоимость приема от: 1960 руб (средняя стоимость приема);
|
101 |
+
стаж: 24 года; квалификация: врач высшей категории; пациенты: взрослые; тип приёма:
|
102 |
+
в клинике; курская, царицыно, депо, силикатная, чкаловская, первомайская; специальность:
|
103 |
+
гастроэнтеролог, терапевт, эндокринолог, гепатолог; специализация: акрокефалия,
|
104 |
+
грипп, болезнь ещё гепатолог алкогольный фиброз и склероз печени, амилоидоз кишечника,
|
105 |
+
ларинготрахеиты, болезни печени, лекарственные поражения печени, острые и хронические
|
106 |
+
пиелонефриты специализируется на лечении гастроэнтеролог аденоматозный полип,
|
107 |
+
атрезия желчевыводящих путей, язвенная болезнь желудка и 12перстной кишки, гестоз,
|
108 |
+
гипервитаминоз, бронхит, гиповитаминоз, гепатолиенальный синдром, алкогольная
|
109 |
+
болезнь печени, бронхоэктатическая болезнь, бронхиальная астма диагностикой и
|
110 |
+
лечением сердечнососудистой системы артериальная гипертензия, вирусные заболевания,
|
111 |
+
бронхиолит, гиперкапния, гепаторенальный синдром, желчного пузыря и желчевыводящих
|
112 |
+
путей, некроз печени, нарушения обмена углеводов, ишемическая болезнь сердца,
|
113 |
+
недостаточность витамина а, болезнь вольмана, гиперкалиемия, нарушения ритма диагностикой
|
114 |
+
и лечением заболеваний желудочнокишечного тракта острые и хронические гастриты,
|
115 |
+
болезни желудка и двенадцатиперстной кишки, гепатит, аппендикулярные камни, аутоиммунные
|
116 |
+
заболевания, анкилостомидоз, болезни поджелудочной железы, первичный билиарный
|
117 |
+
цирроз печени терапевт аденовирусная инфекция, вирусные инфекции, гименоптеризм,
|
118 |
+
недостаточность витамина в12, болезни брюшины, алкогольный цирроз печени, атрофический
|
119 |
+
гастрит, инфекционные болезни, пневмонии, амебный абсцесс печени, болезнь вильсонаконовалова,
|
120 |
+
ахалазия пищевода, анкилостомоз, болезни органов пищеварения, поджелудочной железы
|
121 |
+
диагностикой и лечением заболеваний мочевыделительной системы циститы, недостаточность
|
122 |
+
витамина d, аденовирусный менингит, вирусные болезни, аутоиммунный гепатит, безоар,
|
123 |
+
иммунодефицит, гриппозный менингит, недостаточность, алиментарная диспепсия, гепатит
|
124 |
+
алкогольный, микобактериоз, гепатоз, энтериты и колиты различной этиологии, алкогольный
|
125 |
+
фиброз и склероз печени, болезни пищевода, диагностикой и лечением заболеваний
|
126 |
+
органов дыхания острые и хронические бронхиты'
|
127 |
+
- source_sentence: 'У меня сильная боль в спине, возможно, межпозвонковая грыжа. К
|
128 |
+
какому специалисту мне обратиться и где он принимает? Мне бы хотелось попасть
|
129 |
+
к врачу-мужчине со стажем более 30 лет, желательно в районе Калужской.
|
130 |
+
|
131 |
+
|
132 |
+
|
133 |
+
'
|
134 |
+
sentences:
|
135 |
+
- 'малинина наталья анатольевна; стоимость приема от: 2870 руб (средняя стоимость
|
136 |
+
приема); стаж: 22 года; пациенты: взрослые; воронцовская, проспект вернадского,
|
137 |
+
новаторская, коньково, беляево; специальность: гастроэнтеролог, гепатолог; специализация:
|
138 |
+
кишечника, д, заболевания печени вирусные гепатиты в, алкогольная болезнь печени,
|
139 |
+
12перстной кишки, желудка, с, циррозы любой этиологии, лекарственный гепатит ведение
|
140 |
+
пациентов гастроэнтерологического профиля заболевания пищевода, аутоиммунные заболевания
|
141 |
+
печени, поджелудочной железы'
|
142 |
+
- 'котова мария алексеевна; стоимость приема от: 1900 руб (средняя стоимость приема);
|
143 |
+
стаж: 10 лет; квалификация: врач первой категории; пациенты: взрослые; тип приёма:
|
144 |
+
в клинике; клиника: медицинский центр филин гуд; рабочий посёлок, молодежная;
|
145 |
+
специальность: терапевт, дерматовенеролог, дерматолог, венеролог, трихолог, косметолог;
|
146 |
+
специализация: акне гнойничковые болезни пиодермии'
|
147 |
+
- 'шахов валерий вячеславович; стоимость приема от: 1900 руб (средняя стоимость
|
148 |
+
приема); стаж: 28 лет; тип приёма: в клинике; клиника: ист клиник в беляево; калужская,
|
149 |
+
коньково, беляево; специальность: мануальный терапевт, ортопед, вертебролог, реабилитолог,
|
150 |
+
травматолог, артролог; специализация: кифоза, спондилез поясничнокрестцового отдела
|
151 |
+
позвоночника ортопед артроз неуточненный, спондилеза, плексита, грыжа позвоночника
|
152 |
+
поясничного отдела, артритов, грыжа шморля, защемление грыжи позвоночника, секвестрированная
|
153 |
+
грыжа позвоночника ещё травматолог артроз неуточненный, протрузий, спондилез поясничнокрестцового
|
154 |
+
отдела позвоночника мануальный терапевт межпозвоночная грыжа поясничнокрестцового
|
155 |
+
отдела позвоночника, межпозвоночных грыж, бурсит, перелом, бурсит плеча, грыжа,
|
156 |
+
секвестрированная грыжа позвоночника поясничного отдела, грыжа позвоночника, бурсит
|
157 |
+
локтевого сустава, спондилез поясничнокрестцового отдела позвоночника, грыжа шейного
|
158 |
+
отдела позвоночника, полиартрит, бурсит коленного сустава, нарушения осанки воспалений
|
159 |
+
мышц миозита, бурсита невротических расстройств головных болей вегетативной нервной
|
160 |
+
системы межреберной невралгии желудочнокишечного тракта запоров, радикулита, спондилез
|
161 |
+
грудного отдела позвоночника, сколиоза, межпозвоночная грыжа поясничнокрестцового
|
162 |
+
отдела позвоночника, спондилез, бурситы бедра, нарушения осанки, обострение грыжи
|
163 |
+
поясничного отдела, синдрома раздраженного кишечника специализируется на лечении
|
164 |
+
артролог бурсит плеча вертебролог грыжа, сколиоз, заболеваний позвоночника остеохондроза,
|
165 |
+
грыжа шморля поясничного отдела позвоночника, бурсит локтевого отростка, миалгии
|
166 |
+
заболеваний суставов артроза, грыжи шморля, грыжа между 4 и 5 позвонком'
|
167 |
+
- source_sentence: "У меня сильная боль в спине, боюсь, что это может быть грыжа.\
|
168 |
+
\ К кому мне обратиться за консультацией и лечением? Врач должен быть женщиной,\
|
169 |
+
\ а клиника находиться недалеко от метро Технопарк. \n\n \n\n\n"
|
170 |
+
sentences:
|
171 |
+
- 'исаев владимир викторович; стоимость приема от: 5530 руб (высокая стоимость приема);
|
172 |
+
стаж: 33 года; квалификация: врач высшей категории; учёная степень: кандидат медицинских
|
173 |
+
наук; пациенты: взрослые; тип приёма: в клинике; клиника: центр ортопедии и неврологии
|
174 |
+
premium zdravclinic; проспект вернадского, юго-западная; специальность: мануальный
|
175 |
+
терапевт, кинезиолог, реабилитолог; специализация: жгучие боли в стопе острые
|
176 |
+
боли прострелы боль в области крестца, вывих, вывих верхней конечности, врожденная
|
177 |
+
деформация позвоночника, врожденная мышечная кривошея, вывих в локтевом суставе,
|
178 |
+
вывих голеностопного сустава, вывих ладьевидной кости, копчика болезненные менструации
|
179 |
+
специализируется на лечении мануальный терапевт болезнь шляттера, вывих запястья,
|
180 |
+
мигренеподобные боли боли в суставах при артрозах синдром хронической усталости
|
181 |
+
невралгические боли в области сердца боль, головные, онемение пальцев руки боль
|
182 |
+
между лопатками, врожденная деформация стопы, врожденные деформации грудной клетки,
|
183 |
+
вывих акромиально ключичного сустава, иррадиация боли в нижние конечности тянущие
|
184 |
+
боли в ноге, вывих бедра, врожденные деформации бедра, вывих надколенника, вывих
|
185 |
+
пальца кисти, ограничение подвижности в шейном отделе позвоночника иррадиация
|
186 |
+
боли из шеи в руку, в грудном отделе позвоночника боль в поясничном отделе позвоночника,
|
187 |
+
вывих коленного сустава, вывих плечевого сустава, вывих пальца стопы, врожденные
|
188 |
+
костно мышечные деформации, в пятке'
|
189 |
+
- 'богуш ольга евгеньевна; стоимость приема от: 5000 руб (высокая стоимость приема);
|
190 |
+
стаж: 16 лет; пациенты: взрослые; тип приёма: в клинике; клиника: клиника доктора
|
191 |
+
есиповой; тестовская, шелепиха, улица 1905 года; специальность: врач функциональной
|
192 |
+
диагностики, пульмонолог; специализация: длительного кашля неуточненного характера
|
193 |
+
острой респираторной вирусной инфекции острых и хронических бронхитов вирусных
|
194 |
+
и бактериальных пневмоний плевритов хронической обструктивной болезни легких бронхиальной
|
195 |
+
астмы бронхиолитов бронхоэктазий саркоидоза органов дыхания грибковых заболеваний
|
196 |
+
легких интерстициальных заболеваний легких'
|
197 |
+
- 'кузнецова наталья николаевна; стоимость приема от: 5000 руб (высокая стоимость
|
198 |
+
приема); стаж: 9 лет; пациенты: взрослые; тип приёма: в клинике; клиника: клиникаtemed
|
199 |
+
(темед) на технопарке; технопарк, кленовый бульвар; специальность: невролог, вертебролог;
|
200 |
+
специализация: сдавления нервных корешков и сплетений при, грыжа шейного отдела
|
201 |
+
позвоночника, грыжа позвоночника, обострение грыжи поясничного отдела, грыжа позвоночника
|
202 |
+
поясничного отдела, остеохондроз позвоночника у взрослых, грыжа шморля, защемление
|
203 |
+
грыжи позвоночника, остеохондроз поясничный, грыжа шморля поясничного отдела позвоночника,
|
204 |
+
остеохондроз крестцовый, дорзальная грыжа, межпозвоночная грыжа поясничнокрестцового
|
205 |
+
отдела позвоночника, остеохондроз, грыжа между 4 и 5 позвонком, дегенеративные
|
206 |
+
заболевания позвоночника безоперационное лечение межпозвонковых грыж методом ткачеваепифанова
|
207 |
+
полинейропатии различной этиологии заболевания центральной и периферической нервной
|
208 |
+
системы острый и хронический болевой синдром головные боли различной этимологии
|
209 |
+
специализируется на лечении вертебролог грыжа, секвестрированная грыжа позвоночника
|
210 |
+
поясничного отдела невролог грыжа, дегенерации межпозвоночного диска'
|
211 |
+
---
|
212 |
+
|
213 |
+
# SentenceTransformer based on Mykes/med-MiniLM-L12-3059
|
214 |
+
|
215 |
+
This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [Mykes/med-MiniLM-L12-3059](https://huggingface.co/Mykes/med-MiniLM-L12-3059). It maps sentences & paragraphs to a 384-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
|
216 |
+
|
217 |
+
## Model Details
|
218 |
+
|
219 |
+
### Model Description
|
220 |
+
- **Model Type:** Sentence Transformer
|
221 |
+
- **Base model:** [Mykes/med-MiniLM-L12-3059](https://huggingface.co/Mykes/med-MiniLM-L12-3059) <!-- at revision 5af1ab1230ade9373777ce05046b2742e01588c6 -->
|
222 |
+
- **Maximum Sequence Length:** 128 tokens
|
223 |
+
- **Output Dimensionality:** 384 tokens
|
224 |
+
- **Similarity Function:** Cosine Similarity
|
225 |
+
<!-- - **Training Dataset:** Unknown -->
|
226 |
+
<!-- - **Language:** Unknown -->
|
227 |
+
<!-- - **License:** Unknown -->
|
228 |
+
|
229 |
+
### Model Sources
|
230 |
+
|
231 |
+
- **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
|
232 |
+
- **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
|
233 |
+
- **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
|
234 |
+
|
235 |
+
### Full Model Architecture
|
236 |
+
|
237 |
+
```
|
238 |
+
SentenceTransformer(
|
239 |
+
(0): Transformer({'max_seq_length': 128, 'do_lower_case': False}) with Transformer model: BertModel
|
240 |
+
(1): Pooling({'word_embedding_dimension': 384, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
|
241 |
+
)
|
242 |
+
```
|
243 |
+
|
244 |
+
## Usage
|
245 |
+
|
246 |
+
### Direct Usage (Sentence Transformers)
|
247 |
+
|
248 |
+
First install the Sentence Transformers library:
|
249 |
+
|
250 |
+
```bash
|
251 |
+
pip install -U sentence-transformers
|
252 |
+
```
|
253 |
+
|
254 |
+
Then you can load this model and run inference.
|
255 |
+
```python
|
256 |
+
from sentence_transformers import SentenceTransformer
|
257 |
+
|
258 |
+
# Download from the 🤗 Hub
|
259 |
+
model = SentenceTransformer("Mykes/med-MiniLM-L12-4124")
|
260 |
+
# Run inference
|
261 |
+
sentences = [
|
262 |
+
'У меня сильная боль в спине, боюсь, что это может быть грыжа. К кому мне обратиться за консультацией и лечением? Врач должен быть женщиной, а клиника находиться недалеко от метро Технопарк. \n\n \n\n\n',
|
263 |
+
'кузнецова наталья николаевна; стоимость приема от: 5000 руб (высокая стоимость приема); стаж: 9 лет; пациенты: взрослые; тип приёма: в клинике; клиника: клиникаtemed (темед) на технопарке; технопарк, кленовый бульвар; специальность: невролог, вертебролог; специализация: сдавления нервных корешков и сплетений при, грыжа шейного отдела позвоночника, грыжа позвоночника, обострение грыжи поясничного отдела, грыжа позвоночника поясничного отдела, остеохондроз позвоночника у взрослых, грыжа шморля, защемление грыжи позвоночника, остеохондроз поясничный, грыжа шморля поясничного отдела позвоночника, остеохондроз крестцовый, дорзальная грыжа, межпозвоночная грыжа поясничнокрестцового отдела позвоночника, остеохондроз, грыжа между 4 и 5 позвонком, дегенеративные заболевания позвоночника безоперационное лечение межпозвонковых грыж методом ткачеваепифанова полинейропатии различной этиологии заболевания центральной и периферической нервной системы острый и хронический болевой синдром головные боли различной этимологии специализируется на лечении вертебролог грыжа, секвестрированная грыжа позвоночника поясничного отдела невролог грыжа, дегенерации межпозвоночного диска',
|
264 |
+
'богуш ольга евгеньевна; стоимость приема от: 5000 руб (высокая стоимость приема); стаж: 16 лет; пациенты: взрослые; тип приёма: в клинике; клиника: клиника доктора есиповой; тестовская, шелепиха, улица 1905 года; специальность: врач функциональной диагностики, пульмонолог; специализация: длительного кашля неуточненного характера острой респираторной вирусной инфекции острых и хронических бронхитов вирусных и бактериальных пневмоний плевритов хронической обструктивной болезни легких бронхиальной астмы бронхиолитов бронхоэктазий саркоидоза органов дыхания грибковых заболеваний легких интерстициальных заболеваний легких',
|
265 |
+
]
|
266 |
+
embeddings = model.encode(sentences)
|
267 |
+
print(embeddings.shape)
|
268 |
+
# [3, 384]
|
269 |
+
|
270 |
+
# Get the similarity scores for the embeddings
|
271 |
+
similarities = model.similarity(embeddings, embeddings)
|
272 |
+
print(similarities.shape)
|
273 |
+
# [3, 3]
|
274 |
+
```
|
275 |
+
|
276 |
+
<!--
|
277 |
+
### Direct Usage (Transformers)
|
278 |
+
|
279 |
+
<details><summary>Click to see the direct usage in Transformers</summary>
|
280 |
+
|
281 |
+
</details>
|
282 |
+
-->
|
283 |
+
|
284 |
+
<!--
|
285 |
+
### Downstream Usage (Sentence Transformers)
|
286 |
+
|
287 |
+
You can finetune this model on your own dataset.
|
288 |
+
|
289 |
+
<details><summary>Click to expand</summary>
|
290 |
+
|
291 |
+
</details>
|
292 |
+
-->
|
293 |
+
|
294 |
+
<!--
|
295 |
+
### Out-of-Scope Use
|
296 |
+
|
297 |
+
*List how the model may foreseeably be misused and address what users ought not to do with the model.*
|
298 |
+
-->
|
299 |
+
|
300 |
+
<!--
|
301 |
+
## Bias, Risks and Limitations
|
302 |
+
|
303 |
+
*What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
|
304 |
+
-->
|
305 |
+
|
306 |
+
<!--
|
307 |
+
### Recommendations
|
308 |
+
|
309 |
+
*What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
|
310 |
+
-->
|
311 |
+
|
312 |
+
## Training Details
|
313 |
+
|
314 |
+
### Training Dataset
|
315 |
+
|
316 |
+
#### Unnamed Dataset
|
317 |
+
|
318 |
+
|
319 |
+
* Size: 3,299 training samples
|
320 |
+
* Columns: <code>anchor</code> and <code>positive</code>
|
321 |
+
* Approximate statistics based on the first 1000 samples:
|
322 |
+
| | anchor | positive |
|
323 |
+
|:--------|:------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
|
324 |
+
| type | string | string |
|
325 |
+
| details | <ul><li>min: 12 tokens</li><li>mean: 39.41 tokens</li><li>max: 128 tokens</li></ul> | <ul><li>min: 74 tokens</li><li>mean: 125.91 tokens</li><li>max: 128 tokens</li></ul> |
|
326 |
+
* Samples:
|
327 |
+
| anchor | positive |
|
328 |
+
|:--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
|
329 |
+
| <code>У меня болит живот и тошнит после употребления жирной пищи. К какому специалисту лучше обратиться в районе Народного Ополчения? <br><br><br><br></code> | <code>панёвина лариса викторовна; стоимость приема от: 1500 руб (средняя стоимость приема); стаж: 33 года; пациенты: взрослые; тип приёма: в клинике; клиника: горклиника на октябрьском поле; народное ополчение, октябрьское поле; специальность: гастроэнтеролог, гепатолог; специализация: ещё гепатолог абсцесс печени, амилоидоз кишечника, алкогольная печеночная недостаточность, вирусный гепатит с, болезни печени, гепатит d, гепатит a с печеночной комой, атрезия желчевыводящих путей, гепатобластома, амилоидоз печени, вирусный гепатит при беременности, гепатит b, анизакидоз, ахалазия кардии, вирусный гепатит е, гепатит e, абсцесс селезенки, алкогольный жировой гепатоз печени, вирусный гепатит в, алкогольная болезнь печени, гепатолиенальный, болезнь андерсена, гепатит, аппендикулярные камни, альвеококкоз, анкилостомидоз, аденоматозный полип, алиментарная дистрофия, алкогольный цирроз печени, атрофический гастрит, амебный абсцесс печени, желчнекаменная болезнь дуоденит тифлит колит дивертикулез гепатиты проктит энтероколиты цирроз печени специализируется на лечении гастроэнтеролог абсцесс кишечника, гепатит а, гемолитическая желтуха новорожденных, ахалазия пищевода, вирусный гепатит g, анкилостомоз, ахалазия, аскаридоз, ахлоргидрия, аутоиммунный гепатит, болезнь герса, гепатит с, алиментарная диспепсия, гепатит алкогольный, гепатоз, атрофия сосочков языка, алкогольный фиброз и склероз печени, аномалии развития пищевода</code> |
|
330 |
+
| <code>У меня сильные боли в верхней части живота, которые усиливаются после еды. Также появилась тошнота и горечь во рту. Что это может быть и нужно ли мне обратиться к гастроэнтерологу?</code> | <code>вяллов сергей сергеевич; стоимость приема от: 3500 руб (средняя стоимость приема); стаж: 37 лет; звание: профессор; квалификация: врач первой категории; специальность: гастроэнтеролог; пациенты: взрослые; тип приёма: в клинике; клиника: cmd текстильщики; авиамоторная, римская, перово, текстильщики, люблино, печатники, кузьминки; специализация: дивертикулы пищевода грыжа пищеводного отверстия новообразования доброкачественные и злокачественные панкреатит дискинезия желчных путей холецистит специализируется на лечении гастроэнтеролог заболевания желудочнокишечного тракта</code> |
|
331 |
+
| <code>У меня появились боли в пояснице и онемение в ногах. Может ли это быть связано с грыжей позвоночника? Какие обследования мне нужно пройти для подтверждения диагноза?</code> | <code>анисимова елена игоревна; стоимость приема от: 7000 руб (высокая стоимость приема); стаж: 25 лет; квалификация: врач высшей категории; учёная степень: кандидат медицинских наук; пациенты: взрослые; тип приёма: в клинике; крылатское, молодежная, кунцевская, щелковская; специальность: невролог, врач функциональной диагностики, нейрофизиолог; специализация: вертебробазилярная недостаточность, болевые синдромы различной л��кализации тазовая боль вегетативные нарушения головная боль головокружения депрессии дистонии лечение гипергидроза лечение фобий мигрень обмороки офисный синдром панические атаки последствия стресса радикулиты тревоги нейрофизиологиеские методы обследования нервной системы вызванные потенциалы транскраниальная магнитная стимуляция исследование болевых систем и систем чувствительности диагностика тазовых нарушений, головокружение, грыжа шморля, атаксия, грыжа, грыжа позвоночника, вегетососудистая дистония, воспалительная миопатия, вялая тетраплегия, бессонница, атеросклероз, тазовой боли и нарушения сексуальной функции с помощью электронейромиографии специализируется на лечении невролог алкогольная полиневропатия нижних конечностей, вегетоневроз, воспалительные полинейропатии, аноксическое поражение головного мозга, алкогольная полинейропатия, вестибулярный нейронит, вялая параплегия, грыжа шморля поясничного отдела позвоночника, астения, головокружение центрального генеза, грыжа между 4 и 5 позвонком</code> |
|
332 |
+
* Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
|
333 |
+
```json
|
334 |
+
{
|
335 |
+
"scale": 20.0,
|
336 |
+
"similarity_fct": "cos_sim"
|
337 |
+
}
|
338 |
+
```
|
339 |
+
|
340 |
+
### Evaluation Dataset
|
341 |
+
|
342 |
+
#### Unnamed Dataset
|
343 |
+
|
344 |
+
|
345 |
+
* Size: 825 evaluation samples
|
346 |
+
* Columns: <code>anchor</code> and <code>positive</code>
|
347 |
+
* Approximate statistics based on the first 1000 samples:
|
348 |
+
| | anchor | positive |
|
349 |
+
|:--------|:------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
|
350 |
+
| type | string | string |
|
351 |
+
| details | <ul><li>min: 13 tokens</li><li>mean: 38.95 tokens</li><li>max: 128 tokens</li></ul> | <ul><li>min: 85 tokens</li><li>mean: 125.77 tokens</li><li>max: 128 tokens</li></ul> |
|
352 |
+
* Samples:
|
353 |
+
| anchor | positive |
|
354 |
+
|:-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
|
355 |
+
| <code>У меня на коже появились бородавки, врач подозревает вирус папилломы человека. Какие препараты от этой инфекции Вы можете порекомендовать?</code> | <code>алиханов андрей халларович; стоимость приема от: 2100 руб (средняя стоимость приема); стаж: 29 лет; квалификация: врач высшей категории; пациенты: взрослые; тип приёма: в клинике; красногвардейская, борисово, пражская, шипиловская; специальность: венеролог, дерматолог, миколог, дерматовенеролог; специализация: атопический дерматит неуточненный, ранний врожденный сифилис, диссеминированный герпес, актиническая гранулема, аллергическая крапивница, гонококковый фарингит, атрофические полосы, белый лишай, бластомикоз, микоз стоп, кольпит генитальный кандидоз специализируется на лечении венеролог аногенитальные бородавки, грибок ногтей, анетодермия швеннингера буцци, белая пьедра, врожденный сифилис, поражение вульвы, атрофодермия пазини пьерини, заболевания органов половой системы вирусной этиологии папилломавирусная инфекция генитальный герпес воспалительные процессы половых органов, герпес, лобомикоз, гонорея, акне вульгарис, гонококковая инфекция, акне средней степени тяжести, стафилококками, акне, актинический кератоз, амилоидоз кожи, гонорея у женщин, висцеральный сифилис, болезни кожи и подкожной клетчатки, остроконечные кондиломы, цистит, вирус папилломы человека, болезни ногтей, бородавки, кандидоз, грибок стопы, сифилис, кишечной палочкой и другими представителями патогенной и условно патогенной микрофлоры уретрит, паховый грибок, алопеция тотальная, атрофия кожи, буллезный эпидермолиз, вирусные бородавки, сифилис ещё дерматолог аденома сальной железы, простой герпес, вызванные стрептококками, гранулема лица, кандидамикоз, паховая гранулема, генитальный герпес, болезни полового члена, венерическая лимфогранулема, зппп, первичный сифилис, пузырчатка эритематозная, актинический ретикулоид, болезни потовых желез, ещё миколог грибок кожи, вторичный сифилис, кондиломы</code> |
|
356 |
+
| <code>У меня появились зуд и жжение во влагалище. Могут ли эти симптомы быть связаны с грибковым заболеванием?</code> | <code>ромашкин сергей иванович; стоимость приема от: 1500 руб (средняя стоимость приема); стаж: 11 лет; квалификация: врач высшей категории; пациенты: взрослые; клиника: горклиника в перово; перово, шоссе энтузиастов; специальность: гастроэнтеролог, невролог, дерматовенеролог; специализация: заболевания органов половой системы вирусной этиологии папилломавирусная инфекция генитальный герпес воспалительные процессы половых органов, вызванные стрептококками, цистит, кишечной палочкой и другими представителями патогенной и условно патогенной микрофлоры уретрит, стафилококками, кольпит генитальный кандидоз</code> |
|
357 |
+
| <code>У меня проблемы с осанкой, болит спина. Можно ли с помощью ЛФК исправить осанку и снять боль? Какие типы занятий вы проводите для взрослых? Какова стоимость одного занятия?</code> | <code>батухтина эллина раисовна; стоимость приема от: 8500 руб (высокая стоимость приема); стаж: 9 лет; специальность: врач лфк; тип приёма: в клинике; клиника: ао медицина; улица 1905 года, белорусская, смоленская, киевская, проспект мира, маяковская; специализация: проведение лфк групповые и индивидуальные занятия у детей и взрослых с нарушениями опорнодвигательного аппарата составление и проведение индивидуальных занятий реабилитации</code> |
|
358 |
+
* Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
|
359 |
+
```json
|
360 |
+
{
|
361 |
+
"scale": 20.0,
|
362 |
+
"similarity_fct": "cos_sim"
|
363 |
+
}
|
364 |
+
```
|
365 |
+
|
366 |
+
### Training Hyperparameters
|
367 |
+
#### Non-Default Hyperparameters
|
368 |
+
|
369 |
+
- `num_train_epochs`: 100.0
|
370 |
+
|
371 |
+
#### All Hyperparameters
|
372 |
+
<details><summary>Click to expand</summary>
|
373 |
+
|
374 |
+
- `overwrite_output_dir`: False
|
375 |
+
- `do_predict`: False
|
376 |
+
- `eval_strategy`: no
|
377 |
+
- `prediction_loss_only`: True
|
378 |
+
- `per_device_train_batch_size`: 8
|
379 |
+
- `per_device_eval_batch_size`: 8
|
380 |
+
- `per_gpu_train_batch_size`: None
|
381 |
+
- `per_gpu_eval_batch_size`: None
|
382 |
+
- `gradient_accumulation_steps`: 1
|
383 |
+
- `eval_accumulation_steps`: None
|
384 |
+
- `learning_rate`: 5e-05
|
385 |
+
- `weight_decay`: 0.0
|
386 |
+
- `adam_beta1`: 0.9
|
387 |
+
- `adam_beta2`: 0.999
|
388 |
+
- `adam_epsilon`: 1e-08
|
389 |
+
- `max_grad_norm`: 1.0
|
390 |
+
- `num_train_epochs`: 100.0
|
391 |
+
- `max_steps`: -1
|
392 |
+
- `lr_scheduler_type`: linear
|
393 |
+
- `lr_scheduler_kwargs`: {}
|
394 |
+
- `warmup_ratio`: 0.0
|
395 |
+
- `warmup_steps`: 0
|
396 |
+
- `log_level`: passive
|
397 |
+
- `log_level_replica`: warning
|
398 |
+
- `log_on_each_node`: True
|
399 |
+
- `logging_nan_inf_filter`: True
|
400 |
+
- `save_safetensors`: True
|
401 |
+
- `save_on_each_node`: False
|
402 |
+
- `save_only_model`: False
|
403 |
+
- `restore_callback_states_from_checkpoint`: False
|
404 |
+
- `no_cuda`: False
|
405 |
+
- `use_cpu`: False
|
406 |
+
- `use_mps_device`: False
|
407 |
+
- `seed`: 42
|
408 |
+
- `data_seed`: None
|
409 |
+
- `jit_mode_eval`: False
|
410 |
+
- `use_ipex`: False
|
411 |
+
- `bf16`: False
|
412 |
+
- `fp16`: False
|
413 |
+
- `fp16_opt_level`: O1
|
414 |
+
- `half_precision_backend`: auto
|
415 |
+
- `bf16_full_eval`: False
|
416 |
+
- `fp16_full_eval`: False
|
417 |
+
- `tf32`: None
|
418 |
+
- `local_rank`: 0
|
419 |
+
- `ddp_backend`: None
|
420 |
+
- `tpu_num_cores`: None
|
421 |
+
- `tpu_metrics_debug`: False
|
422 |
+
- `debug`: []
|
423 |
+
- `dataloader_drop_last`: False
|
424 |
+
- `dataloader_num_workers`: 0
|
425 |
+
- `dataloader_prefetch_factor`: None
|
426 |
+
- `past_index`: -1
|
427 |
+
- `disable_tqdm`: False
|
428 |
+
- `remove_unused_columns`: True
|
429 |
+
- `label_names`: None
|
430 |
+
- `load_best_model_at_end`: False
|
431 |
+
- `ignore_data_skip`: False
|
432 |
+
- `fsdp`: []
|
433 |
+
- `fsdp_min_num_params`: 0
|
434 |
+
- `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
|
435 |
+
- `fsdp_transformer_layer_cls_to_wrap`: None
|
436 |
+
- `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
|
437 |
+
- `deepspeed`: None
|
438 |
+
- `label_smoothing_factor`: 0.0
|
439 |
+
- `optim`: adamw_torch
|
440 |
+
- `optim_args`: None
|
441 |
+
- `adafactor`: False
|
442 |
+
- `group_by_length`: False
|
443 |
+
- `length_column_name`: length
|
444 |
+
- `ddp_find_unused_parameters`: None
|
445 |
+
- `ddp_bucket_cap_mb`: None
|
446 |
+
- `ddp_broadcast_buffers`: False
|
447 |
+
- `dataloader_pin_memory`: True
|
448 |
+
- `dataloader_persistent_workers`: False
|
449 |
+
- `skip_memory_metrics`: True
|
450 |
+
- `use_legacy_prediction_loop`: False
|
451 |
+
- `push_to_hub`: False
|
452 |
+
- `resume_from_checkpoint`: None
|
453 |
+
- `hub_model_id`: None
|
454 |
+
- `hub_strategy`: every_save
|
455 |
+
- `hub_private_repo`: False
|
456 |
+
- `hub_always_push`: False
|
457 |
+
- `gradient_checkpointing`: False
|
458 |
+
- `gradient_checkpointing_kwargs`: None
|
459 |
+
- `include_inputs_for_metrics`: False
|
460 |
+
- `eval_do_concat_batches`: True
|
461 |
+
- `fp16_backend`: auto
|
462 |
+
- `push_to_hub_model_id`: None
|
463 |
+
- `push_to_hub_organization`: None
|
464 |
+
- `mp_parameters`:
|
465 |
+
- `auto_find_batch_size`: False
|
466 |
+
- `full_determinism`: False
|
467 |
+
- `torchdynamo`: None
|
468 |
+
- `ray_scope`: last
|
469 |
+
- `ddp_timeout`: 1800
|
470 |
+
- `torch_compile`: False
|
471 |
+
- `torch_compile_backend`: None
|
472 |
+
- `torch_compile_mode`: None
|
473 |
+
- `dispatch_batches`: None
|
474 |
+
- `split_batches`: None
|
475 |
+
- `include_tokens_per_second`: False
|
476 |
+
- `include_num_input_tokens_seen`: False
|
477 |
+
- `neftune_noise_alpha`: None
|
478 |
+
- `optim_target_modules`: None
|
479 |
+
- `batch_eval_metrics`: False
|
480 |
+
- `eval_on_start`: False
|
481 |
+
- `batch_sampler`: batch_sampler
|
482 |
+
- `multi_dataset_batch_sampler`: proportional
|
483 |
+
|
484 |
+
</details>
|
485 |
+
|
486 |
+
### Training Logs
|
487 |
+
| Epoch | Step | Training Loss |
|
488 |
+
|:-------:|:-----:|:-------------:|
|
489 |
+
| 1.2107 | 500 | 0.2302 |
|
490 |
+
| 2.4213 | 1000 | 0.1409 |
|
491 |
+
| 3.6320 | 1500 | 0.0976 |
|
492 |
+
| 4.8426 | 2000 | 0.0792 |
|
493 |
+
| 6.0533 | 2500 | 0.085 |
|
494 |
+
| 7.2639 | 3000 | 0.0677 |
|
495 |
+
| 8.4746 | 3500 | 0.0563 |
|
496 |
+
| 9.6852 | 4000 | 0.0562 |
|
497 |
+
| 10.8959 | 4500 | 0.0384 |
|
498 |
+
| 12.1065 | 5000 | 0.0407 |
|
499 |
+
| 13.3172 | 5500 | 0.043 |
|
500 |
+
| 14.5278 | 6000 | 0.0318 |
|
501 |
+
| 15.7385 | 6500 | 0.031 |
|
502 |
+
| 16.9492 | 7000 | 0.027 |
|
503 |
+
| 18.1598 | 7500 | 0.02 |
|
504 |
+
| 19.3705 | 8000 | 0.0209 |
|
505 |
+
| 20.5811 | 8500 | 0.0221 |
|
506 |
+
| 21.7918 | 9000 | 0.0167 |
|
507 |
+
| 23.0024 | 9500 | 0.0207 |
|
508 |
+
| 24.2131 | 10000 | 0.0194 |
|
509 |
+
|
510 |
+
|
511 |
+
### Framework Versions
|
512 |
+
- Python: 3.10.12
|
513 |
+
- Sentence Transformers: 3.0.1
|
514 |
+
- Transformers: 4.42.4
|
515 |
+
- PyTorch: 2.4.0+cu121
|
516 |
+
- Accelerate: 0.32.1
|
517 |
+
- Datasets: 2.21.0
|
518 |
+
- Tokenizers: 0.19.1
|
519 |
+
|
520 |
+
## Citation
|
521 |
+
|
522 |
+
### BibTeX
|
523 |
+
|
524 |
+
#### Sentence Transformers
|
525 |
+
```bibtex
|
526 |
+
@inproceedings{reimers-2019-sentence-bert,
|
527 |
+
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
|
528 |
+
author = "Reimers, Nils and Gurevych, Iryna",
|
529 |
+
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
|
530 |
+
month = "11",
|
531 |
+
year = "2019",
|
532 |
+
publisher = "Association for Computational Linguistics",
|
533 |
+
url = "https://arxiv.org/abs/1908.10084",
|
534 |
+
}
|
535 |
+
```
|
536 |
+
|
537 |
+
#### MultipleNegativesRankingLoss
|
538 |
+
```bibtex
|
539 |
+
@misc{henderson2017efficient,
|
540 |
+
title={Efficient Natural Language Response Suggestion for Smart Reply},
|
541 |
+
author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
|
542 |
+
year={2017},
|
543 |
+
eprint={1705.00652},
|
544 |
+
archivePrefix={arXiv},
|
545 |
+
primaryClass={cs.CL}
|
546 |
+
}
|
547 |
+
```
|
548 |
+
|
549 |
+
<!--
|
550 |
+
## Glossary
|
551 |
+
|
552 |
+
*Clearly define terms in order to be accessible across audiences.*
|
553 |
+
-->
|
554 |
+
|
555 |
+
<!--
|
556 |
+
## Model Card Authors
|
557 |
+
|
558 |
+
*Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
|
559 |
+
-->
|
560 |
+
|
561 |
+
<!--
|
562 |
+
## Model Card Contact
|
563 |
+
|
564 |
+
*Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
|
565 |
+
-->
|
config.json
ADDED
@@ -0,0 +1,26 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"_name_or_path": "Mykes/med-MiniLM-L12-3059",
|
3 |
+
"architectures": [
|
4 |
+
"BertModel"
|
5 |
+
],
|
6 |
+
"attention_probs_dropout_prob": 0.1,
|
7 |
+
"classifier_dropout": null,
|
8 |
+
"gradient_checkpointing": false,
|
9 |
+
"hidden_act": "gelu",
|
10 |
+
"hidden_dropout_prob": 0.1,
|
11 |
+
"hidden_size": 384,
|
12 |
+
"initializer_range": 0.02,
|
13 |
+
"intermediate_size": 1536,
|
14 |
+
"layer_norm_eps": 1e-12,
|
15 |
+
"max_position_embeddings": 512,
|
16 |
+
"model_type": "bert",
|
17 |
+
"num_attention_heads": 12,
|
18 |
+
"num_hidden_layers": 12,
|
19 |
+
"pad_token_id": 0,
|
20 |
+
"position_embedding_type": "absolute",
|
21 |
+
"torch_dtype": "float32",
|
22 |
+
"transformers_version": "4.42.4",
|
23 |
+
"type_vocab_size": 2,
|
24 |
+
"use_cache": true,
|
25 |
+
"vocab_size": 250037
|
26 |
+
}
|
config_sentence_transformers.json
ADDED
@@ -0,0 +1,10 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"__version__": {
|
3 |
+
"sentence_transformers": "3.0.1",
|
4 |
+
"transformers": "4.42.4",
|
5 |
+
"pytorch": "2.4.0+cu121"
|
6 |
+
},
|
7 |
+
"prompts": {},
|
8 |
+
"default_prompt_name": null,
|
9 |
+
"similarity_fn_name": null
|
10 |
+
}
|
model.safetensors
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:d4deee9cce9074a680ca5b7776992e2a6a18cb74f1d26e7e88e152de0942e4ae
|
3 |
+
size 470637416
|
modules.json
ADDED
@@ -0,0 +1,14 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
[
|
2 |
+
{
|
3 |
+
"idx": 0,
|
4 |
+
"name": "0",
|
5 |
+
"path": "",
|
6 |
+
"type": "sentence_transformers.models.Transformer"
|
7 |
+
},
|
8 |
+
{
|
9 |
+
"idx": 1,
|
10 |
+
"name": "1",
|
11 |
+
"path": "1_Pooling",
|
12 |
+
"type": "sentence_transformers.models.Pooling"
|
13 |
+
}
|
14 |
+
]
|
sentence_bert_config.json
ADDED
@@ -0,0 +1,4 @@
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"max_seq_length": 128,
|
3 |
+
"do_lower_case": false
|
4 |
+
}
|
special_tokens_map.json
ADDED
@@ -0,0 +1,51 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"bos_token": {
|
3 |
+
"content": "<s>",
|
4 |
+
"lstrip": false,
|
5 |
+
"normalized": false,
|
6 |
+
"rstrip": false,
|
7 |
+
"single_word": false
|
8 |
+
},
|
9 |
+
"cls_token": {
|
10 |
+
"content": "<s>",
|
11 |
+
"lstrip": false,
|
12 |
+
"normalized": false,
|
13 |
+
"rstrip": false,
|
14 |
+
"single_word": false
|
15 |
+
},
|
16 |
+
"eos_token": {
|
17 |
+
"content": "</s>",
|
18 |
+
"lstrip": false,
|
19 |
+
"normalized": false,
|
20 |
+
"rstrip": false,
|
21 |
+
"single_word": false
|
22 |
+
},
|
23 |
+
"mask_token": {
|
24 |
+
"content": "<mask>",
|
25 |
+
"lstrip": true,
|
26 |
+
"normalized": false,
|
27 |
+
"rstrip": false,
|
28 |
+
"single_word": false
|
29 |
+
},
|
30 |
+
"pad_token": {
|
31 |
+
"content": "<pad>",
|
32 |
+
"lstrip": false,
|
33 |
+
"normalized": false,
|
34 |
+
"rstrip": false,
|
35 |
+
"single_word": false
|
36 |
+
},
|
37 |
+
"sep_token": {
|
38 |
+
"content": "</s>",
|
39 |
+
"lstrip": false,
|
40 |
+
"normalized": false,
|
41 |
+
"rstrip": false,
|
42 |
+
"single_word": false
|
43 |
+
},
|
44 |
+
"unk_token": {
|
45 |
+
"content": "<unk>",
|
46 |
+
"lstrip": false,
|
47 |
+
"normalized": false,
|
48 |
+
"rstrip": false,
|
49 |
+
"single_word": false
|
50 |
+
}
|
51 |
+
}
|
tokenizer.json
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:cad551d5600a84242d0973327029452a1e3672ba6313c2a3c3d69c4310e12719
|
3 |
+
size 17082987
|
tokenizer_config.json
ADDED
@@ -0,0 +1,64 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"added_tokens_decoder": {
|
3 |
+
"0": {
|
4 |
+
"content": "<s>",
|
5 |
+
"lstrip": false,
|
6 |
+
"normalized": false,
|
7 |
+
"rstrip": false,
|
8 |
+
"single_word": false,
|
9 |
+
"special": true
|
10 |
+
},
|
11 |
+
"1": {
|
12 |
+
"content": "<pad>",
|
13 |
+
"lstrip": false,
|
14 |
+
"normalized": false,
|
15 |
+
"rstrip": false,
|
16 |
+
"single_word": false,
|
17 |
+
"special": true
|
18 |
+
},
|
19 |
+
"2": {
|
20 |
+
"content": "</s>",
|
21 |
+
"lstrip": false,
|
22 |
+
"normalized": false,
|
23 |
+
"rstrip": false,
|
24 |
+
"single_word": false,
|
25 |
+
"special": true
|
26 |
+
},
|
27 |
+
"3": {
|
28 |
+
"content": "<unk>",
|
29 |
+
"lstrip": false,
|
30 |
+
"normalized": false,
|
31 |
+
"rstrip": false,
|
32 |
+
"single_word": false,
|
33 |
+
"special": true
|
34 |
+
},
|
35 |
+
"250001": {
|
36 |
+
"content": "<mask>",
|
37 |
+
"lstrip": true,
|
38 |
+
"normalized": false,
|
39 |
+
"rstrip": false,
|
40 |
+
"single_word": false,
|
41 |
+
"special": true
|
42 |
+
}
|
43 |
+
},
|
44 |
+
"bos_token": "<s>",
|
45 |
+
"clean_up_tokenization_spaces": true,
|
46 |
+
"cls_token": "<s>",
|
47 |
+
"do_lower_case": true,
|
48 |
+
"eos_token": "</s>",
|
49 |
+
"mask_token": "<mask>",
|
50 |
+
"max_length": 128,
|
51 |
+
"model_max_length": 128,
|
52 |
+
"pad_to_multiple_of": null,
|
53 |
+
"pad_token": "<pad>",
|
54 |
+
"pad_token_type_id": 0,
|
55 |
+
"padding_side": "right",
|
56 |
+
"sep_token": "</s>",
|
57 |
+
"stride": 0,
|
58 |
+
"strip_accents": null,
|
59 |
+
"tokenize_chinese_chars": true,
|
60 |
+
"tokenizer_class": "BertTokenizer",
|
61 |
+
"truncation_side": "right",
|
62 |
+
"truncation_strategy": "longest_first",
|
63 |
+
"unk_token": "<unk>"
|
64 |
+
}
|
unigram.json
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:da145b5e7700ae40f16691ec32a0b1fdc1ee3298db22a31ea55f57a966c4a65d
|
3 |
+
size 14763260
|