Mykes commited on
Commit
e7834bd
1 Parent(s): 8afd8d9

Add new SentenceTransformer model.

Browse files
.gitattributes CHANGED
@@ -33,3 +33,5 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
 
 
 
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
36
+ tokenizer.json filter=lfs diff=lfs merge=lfs -text
37
+ unigram.json filter=lfs diff=lfs merge=lfs -text
1_Pooling/config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "word_embedding_dimension": 384,
3
+ "pooling_mode_cls_token": false,
4
+ "pooling_mode_mean_tokens": true,
5
+ "pooling_mode_max_tokens": false,
6
+ "pooling_mode_mean_sqrt_len_tokens": false,
7
+ "pooling_mode_weightedmean_tokens": false,
8
+ "pooling_mode_lasttoken": false,
9
+ "include_prompt": true
10
+ }
README.md ADDED
@@ -0,0 +1,565 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ base_model: Mykes/med-MiniLM-L12-3059
3
+ datasets: []
4
+ language: []
5
+ library_name: sentence-transformers
6
+ pipeline_tag: sentence-similarity
7
+ tags:
8
+ - sentence-transformers
9
+ - sentence-similarity
10
+ - feature-extraction
11
+ - generated_from_trainer
12
+ - dataset_size:3299
13
+ - loss:MultipleNegativesRankingLoss
14
+ widget:
15
+ - source_sentence: Мне поставили диагноз псориаз. Какой препарат мне может помочь
16
+ справиться с этим заболеванием? Какие побочные эффекты могут быть у этого препарата?
17
+ Я слышала о препарате **Ксеомин**, он подходит для лечения псориаза?
18
+ sentences:
19
+ - 'краснова ирина викторовна; стоимость приема от: 2870 руб (средняя стоимость приема);
20
+ стаж: 15 лет; тип приёма: в клинике; клиника: медцентр столица на арбате; смоленская,
21
+ кропоткинская; специальность: венеролог, дерматолог, косметолог, онкодерматолог;
22
+ специализация: крапивница, розацеа, экзема, себорейный дерматит, папилломы, криодеструкцией
23
+ контурная пластика лица препаратами на основе гиалуроновой кислоты киоревитализация
24
+ кожи лица мезотерапия коррекция мимических морщин ботокс, заболеваний кожи, атопический
25
+ дерматит, угревая болезнь, бородавки, кератомы аппаратом сургитрон, микозы, ксеомин,
26
+ фотек, бактериальные и вирусные заболевания дерматоскопия новообразований кожи
27
+ трихоскопия удаление новообразований кожи невусы, лантокс химические пилинги поверхностного
28
+ и срединного действия, волос и ногтей псориаз'
29
+ - 'кошелева евгения николаевна; стоимость приема от: 4300 руб (средняя стоимость
30
+ приема); стаж: 15 лет; квалификация: врач высшей категории; учёная степень: кандидат
31
+ медицинских наук; пациенты: взрослые; тип приёма: в клинике; клиника: клинико-диагностический
32
+ центр медси в грохольском переулке; сухаревская, проспект мира; специальность:
33
+ гастроэнтеролог, терапевт; специализация: хронический гастродуоденит хронический
34
+ холецистит хронический панкреатит гепатит синдром раздраженного кишечника дискинезия
35
+ толстого кишечника гипертоническая болезнь ишемическая болезнь сердца стенокардия
36
+ напряжения хроническая сердечная недостаточность острый и хронический бронхит
37
+ пневмония орви хроническая анемия лихорадка неясного генеза синдром ускоренного
38
+ соэ'
39
+ - 'головкин владимир николаевич; стоимость приема от: 1080 руб (низкая стоимость
40
+ приема); стаж: 20 лет; квалификация: врач высшей категории; пациенты: взрослые;
41
+ тип приёма: в клинике; лермонтовский проспект, улица 1905 года, цска, косино,
42
+ беговая, ухтомская; специальность: ортопед, вертебролог, травматолог, артролог;
43
+ специализация: в том числе посттравматического артроза, энтеропатической артропатии,
44
+ инфекционного и реактивного артритов, подагрического артрита и тд владеет следующими
45
+ методиками, на дифференциальной диагностике и лечении заболеваний опорнодвигательного
46
+ аппарата'
47
+ - source_sentence: У меня сильный запор уже несколько дней. Какие обследования мне
48
+ нужно пройти, чтобы понять причину? Можете ли вы порекомендовать какие-нибудь
49
+ препараты от запора?
50
+ sentences:
51
+ - 'салахутдинова альмира рамилевна; стоимость приема от: 3000 руб (средняя стоимость
52
+ приема); стаж: 5 лет; пациенты: взрослые; тип приёма: в клинике; клиника: клиника
53
+ temed (темед) на фонвизинской; останкино, фонвизинская, петровско-разумовская;
54
+ специальность: невролог, вертебролог; специализация: парез нижних конечностей,
55
+ спины головные боли, грыжа позвоночника поясничного отдела, грыжа шморля, защемление
56
+ грыжи позвоночника, дорзальная грыжа, секвестрированная грыжа позвоночника поясничного
57
+ отдела, грыжа позвоночника, позвоночника, грыжа шейного отдела позвоночника, остеохондроз
58
+ поясничный, остеохондроз крестцовый, секвестрированная грыжа позвоночника, межпозвоночная
59
+ грыжа поясничнокрестцового отдела позвоночника, остеохондроз, мигрень и головокружения
60
+ заболевания внутренних органов мышечный гипертонус остеохондроз позвоночника плечелопаточные
61
+ периартриты радикулит специализируется на лечении вертебролог грыжа, обострение
62
+ грыжи поясничного отдела, грыжа шморля поясничного отдела позвоночника, радикулит,
63
+ спинномозговая грыжа невролог грыжа, грыжа между 4 и 5 позвонком, боли в области
64
+ суставов, остеохондроз позвоночника у взрослых'
65
+ - 'герасименко владимир витальевич; стоимость приема от: 3000 руб (средняя стоимость
66
+ приема); стаж: 29 лет; квалификация: врач высшей категории; учёная степень: кандидат
67
+ медицинских наук; пациенты: взрослые; тип приёма: в клинике; клиника: plasmolifting
68
+ praxis (плазмолифтинг праксис); пролетарская, римская, крестьянская застава; специальность:
69
+ нейрохирург, невролог, вертебролог; специализация: лицевая боли мигрени, последствия
70
+ травм спины и головы болезнь альцгеймера вегетососудистая дистония болезнь паркинсона
71
+ и тд занимается лечением таких проблем, головная, нарушение сознания боли в области
72
+ спины грыжевые образования, остеохондроз и т д инсульт и его последствия травмы,
73
+ радикулит, параличи белла и др судорожные состояния, нервные тики, эпилептические
74
+ припадки, дрожания'
75
+ - 'белихина наталья николаевна; стаж: 20 лет; специальность: гастроэнтеролог; пациенты:
76
+ взрослые; тип приёма: в клинике; клиника: будь здоров на сухаревской; сухаревская,
77
+ сретенский бульвар, трубная; специализация: запор, гепатит, заболевания желудочнокишечного
78
+ тракта, дисбактериоз, панкреатит, эзофагит, язва двенадцатиперстной кишки, язва
79
+ желудка, холецистит, гастрит язва желудка и двенадцатиперстной кишки дисбактериоз
80
+ гепатит диарея понос панкреатит холецистит эзофагит колит запор специализируется
81
+ на лечении гастроэнтеролог гастрит, диарея'
82
+ - source_sentence: У меня уже неделю сильные боли в правом подреберье. Могла ли причиной
83
+ стать жирная пища? Какие обследования мне нужно пройти для выявления причины болей?
84
+ sentences:
85
+ - 'мартыненко дарья марковна; стоимость приема от: 2530 руб (средняя стоимость приема);
86
+ стаж: 3 года; тип приёма: в клинике; клиника: uniклиник (юниклиник); бибирево,
87
+ алтуфьево; специальность: венеролог, дерматолог, дерматовенеролог; специализация:
88
+ экзема и аллергические дерматиты, инфекционные и неинфекционные заболевания кожи
89
+ и её придатков ногтей и волос диагностика и удаление различных новообразований
90
+ на коже диагностика и лечение заболеваний кожи и транзиторных состояний у детей
91
+ грудного и старшего возрастов атопический дерматит, акне'
92
+ - 'попов михаил сергеевич; стоимость приема от: 3000 руб (средняя стоимость приема);
93
+ стаж: 5 лет; пациенты: взрослые; тип приёма: в клинике; клиника: скриндоктор;
94
+ добрынинская, серпуховская, шаболовская; специальность: венеролог, дерматолог,
95
+ дерматовенеролог; специализация: контактный, герпес микозов грибковых заболеваний
96
+ кожи специализируется на лечении дерматолог алопеция тотальная, родинки, псориаз,
97
+ красные родинки, лишаи различных типов псориаз дерматит аллергический, витилиго,
98
+ нейродермит акне угрей экзема розацеа себорея вирусных заболеваний кожи паппиломы,
99
+ бородавки, дерматит, атопический'
100
+ - 'таргаков вадим даулетович; стоимость приема от: 1960 руб (средняя стоимость приема);
101
+ стаж: 24 года; квалификация: врач высшей категории; пациенты: взрослые; тип приёма:
102
+ в клинике; курская, царицыно, депо, силикатная, чкаловская, первомайская; специальность:
103
+ гастроэнтеролог, терапевт, эндокринолог, гепатолог; специализация: акрокефалия,
104
+ грипп, болезнь ещё гепатолог алкогольный фиброз и склероз печени, амилоидоз кишечника,
105
+ ларинготрахеиты, болезни печени, лекарственные поражения печени, острые и хронические
106
+ пиелонефриты специализируется на лечении гастроэнтеролог аденоматозный полип,
107
+ атрезия желчевыводящих путей, язвенная болезнь желудка и 12перстной кишки, гестоз,
108
+ гипервитаминоз, бронхит, гиповитаминоз, гепатолиенальный синдром, алкогольная
109
+ болезнь печени, бронхоэктатическая болезнь, бронхиальная астма диагностикой и
110
+ лечением сердечнососудистой системы артериальная гипертензия, вирусные заболевания,
111
+ бронхиолит, гиперкапния, гепаторенальный синдром, желчного пузыря и желчевыводящих
112
+ путей, некроз печени, нарушения обмена углеводов, ишемическая болезнь сердца,
113
+ недостаточность витамина а, болезнь вольмана, гиперкалиемия, нарушения ритма диагностикой
114
+ и лечением заболеваний желудочнокишечного тракта острые и хронические гастриты,
115
+ болезни желудка и двенадцатиперстной кишки, гепатит, аппендикулярные камни, аутоиммунные
116
+ заболевания, анкилостомидоз, болезни поджелудочной железы, первичный билиарный
117
+ цирроз печени терапевт аденовирусная инфекция, вирусные инфекции, гименоптеризм,
118
+ недостаточность витамина в12, болезни брюшины, алкогольный цирроз печени, атрофический
119
+ гастрит, инфекционные болезни, пневмонии, амебный абсцесс печени, болезнь вильсонаконовалова,
120
+ ахалазия пищевода, анкилостомоз, болезни органов пищеварения, поджелудочной железы
121
+ диагностикой и лечением заболеваний мочевыделительной системы циститы, недостаточность
122
+ витамина d, аденовирусный менингит, вирусные болезни, аутоиммунный гепатит, безоар,
123
+ иммунодефицит, гриппозный менингит, недостаточность, алиментарная диспепсия, гепатит
124
+ алкогольный, микобактериоз, гепатоз, энтериты и колиты различной этиологии, алкогольный
125
+ фиброз и склероз печени, болезни пищевода, диагностикой и лечением заболеваний
126
+ органов дыхания острые и хронические бронхиты'
127
+ - source_sentence: 'У меня сильная боль в спине, возможно, межпозвонковая грыжа. К
128
+ какому специалисту мне обратиться и где он принимает? Мне бы хотелось попасть
129
+ к врачу-мужчине со стажем более 30 лет, желательно в районе Калужской.
130
+
131
+
132
+
133
+ '
134
+ sentences:
135
+ - 'малинина наталья анатольевна; стоимость приема от: 2870 руб (средняя стоимость
136
+ приема); стаж: 22 года; пациенты: взрослые; воронцовская, проспект вернадского,
137
+ новаторская, коньково, беляево; специальность: гастроэнтеролог, гепатолог; специализация:
138
+ кишечника, д, заболевания печени вирусные гепатиты в, алкогольная болезнь печени,
139
+ 12перстной кишки, желудка, с, циррозы любой этиологии, лекарственный гепатит ведение
140
+ пациентов гастроэнтерологического профиля заболевания пищевода, аутоиммунные заболевания
141
+ печени, поджелудочной железы'
142
+ - 'котова мария алексеевна; стоимость приема от: 1900 руб (средняя стоимость приема);
143
+ стаж: 10 лет; квалификация: врач первой категории; пациенты: взрослые; тип приёма:
144
+ в клинике; клиника: медицинский центр филин гуд; рабочий посёлок, молодежная;
145
+ специальность: терапевт, дерматовенеролог, дерматолог, венеролог, трихолог, косметолог;
146
+ специализация: акне гнойничковые болезни пиодермии'
147
+ - 'шахов валерий вячеславович; стоимость приема от: 1900 руб (средняя стоимость
148
+ приема); стаж: 28 лет; тип приёма: в клинике; клиника: ист клиник в беляево; калужская,
149
+ коньково, беляево; специальность: мануальный терапевт, ортопед, вертебролог, реабилитолог,
150
+ травматолог, артролог; специализация: кифоза, спондилез поясничнокрестцового отдела
151
+ позвоночника ортопед артроз неуточненный, спондилеза, плексита, грыжа позвоночника
152
+ поясничного отдела, артритов, грыжа шморля, защемление грыжи позвоночника, секвестрированная
153
+ грыжа позвоночника ещё травматолог артроз неуточненный, протрузий, спондилез поясничнокрестцового
154
+ отдела позвоночника мануальный терапевт межпозвоночная грыжа поясничнокрестцового
155
+ отдела позвоночника, межпозвоночных грыж, бурсит, перелом, бурсит плеча, грыжа,
156
+ секвестрированная грыжа позвоночника поясничного отдела, грыжа позвоночника, бурсит
157
+ локтевого сустава, спондилез поясничнокрестцового отдела позвоночника, грыжа шейного
158
+ отдела позвоночника, полиартрит, бурсит коленного сустава, нарушения осанки воспалений
159
+ мышц миозита, бурсита невротических расстройств головных болей вегетативной нервной
160
+ системы межреберной невралгии желудочнокишечного тракта запоров, радикулита, спондилез
161
+ грудного отдела позвоночника, сколиоза, межпозвоночная грыжа поясничнокрестцового
162
+ отдела позвоночника, спондилез, бурситы бедра, нарушения осанки, обострение грыжи
163
+ поясничного отдела, синдрома раздраженного кишечника специализируется на лечении
164
+ артролог бурсит плеча вертебролог грыжа, сколиоз, заболеваний позвоночника остеохондроза,
165
+ грыжа шморля поясничного отдела позвоночника, бурсит локтевого отростка, миалгии
166
+ заболеваний суставов артроза, грыжи шморля, грыжа между 4 и 5 позвонком'
167
+ - source_sentence: "У меня сильная боль в спине, боюсь, что это может быть грыжа.\
168
+ \ К кому мне обратиться за консультацией и лечением? Врач должен быть женщиной,\
169
+ \ а клиника находиться недалеко от метро Технопарк. \n\n \n\n\n"
170
+ sentences:
171
+ - 'исаев владимир викторович; стоимость приема от: 5530 руб (высокая стоимость приема);
172
+ стаж: 33 года; квалификация: врач высшей категории; учёная степень: кандидат медицинских
173
+ наук; пациенты: взрослые; тип приёма: в клинике; клиника: центр ортопедии и неврологии
174
+ premium zdravclinic; проспект вернадского, юго-западная; специальность: мануальный
175
+ терапевт, кинезиолог, реабилитолог; специализация: жгучие боли в стопе острые
176
+ боли прострелы боль в области крестца, вывих, вывих верхней конечности, врожденная
177
+ деформация позвоночника, врожденная мышечная кривошея, вывих в локтевом суставе,
178
+ вывих голеностопного сустава, вывих ладьевидной кости, копчика болезненные менструации
179
+ специализируется на лечении мануальный терапевт болезнь шляттера, вывих запястья,
180
+ мигренеподобные боли боли в суставах при артрозах синдром хронической усталости
181
+ невралгические боли в области сердца боль, головные, онемение пальцев руки боль
182
+ между лопатками, врожденная деформация стопы, врожденные деформации грудной клетки,
183
+ вывих акромиально ключичного сустава, иррадиация боли в нижние конечности тянущие
184
+ боли в ноге, вывих бедра, врожденные деформации бедра, вывих надколенника, вывих
185
+ пальца кисти, ограничение подвижности в шейном отделе позвоночника иррадиация
186
+ боли из шеи в руку, в грудном отделе позвоночника боль в поясничном отделе позвоночника,
187
+ вывих коленного сустава, вывих плечевого сустава, вывих пальца стопы, врожденные
188
+ костно мышечные деформации, в пятке'
189
+ - 'богуш ольга евгеньевна; стоимость приема от: 5000 руб (высокая стоимость приема);
190
+ стаж: 16 лет; пациенты: взрослые; тип приёма: в клинике; клиника: клиника доктора
191
+ есиповой; тестовская, шелепиха, улица 1905 года; специальность: врач функциональной
192
+ диагностики, пульмонолог; специализация: длительного кашля неуточненного характера
193
+ острой респираторной вирусной инфекции острых и хронических бронхитов вирусных
194
+ и бактериальных пневмоний плевритов хронической обструктивной болезни легких бронхиальной
195
+ астмы бронхиолитов бронхоэктазий саркоидоза органов дыхания грибковых заболеваний
196
+ легких интерстициальных заболеваний легких'
197
+ - 'кузнецова наталья николаевна; стоимость приема от: 5000 руб (высокая стоимость
198
+ приема); стаж: 9 лет; пациенты: взрослые; тип приёма: в клинике; клиника: клиникаtemed
199
+ (темед) на технопарке; технопарк, кленовый бульвар; специальность: невролог, вертебролог;
200
+ специализация: сдавления нервных корешков и сплетений при, грыжа шейного отдела
201
+ позвоночника, грыжа позвоночника, обострение грыжи поясничного отдела, грыжа позвоночника
202
+ поясничного отдела, остеохондроз позвоночника у взрослых, грыжа шморля, защемление
203
+ грыжи позвоночника, остеохондроз поясничный, грыжа шморля поясничного отдела позвоночника,
204
+ остеохондроз крестцовый, дорзальная грыжа, межпозвоночная грыжа поясничнокрестцового
205
+ отдела позвоночника, остеохондроз, грыжа между 4 и 5 позвонком, дегенеративные
206
+ заболевания позвоночника безоперационное лечение межпозвонковых грыж методом ткачеваепифанова
207
+ полинейропатии различной этиологии заболевания центральной и периферической нервной
208
+ системы острый и хронический болевой синдром головные боли различной этимологии
209
+ специализируется на лечении вертебролог грыжа, секвестрированная грыжа позвоночника
210
+ поясничного отдела невролог грыжа, дегенерации межпозвоночного диска'
211
+ ---
212
+
213
+ # SentenceTransformer based on Mykes/med-MiniLM-L12-3059
214
+
215
+ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [Mykes/med-MiniLM-L12-3059](https://huggingface.co/Mykes/med-MiniLM-L12-3059). It maps sentences & paragraphs to a 384-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
216
+
217
+ ## Model Details
218
+
219
+ ### Model Description
220
+ - **Model Type:** Sentence Transformer
221
+ - **Base model:** [Mykes/med-MiniLM-L12-3059](https://huggingface.co/Mykes/med-MiniLM-L12-3059) <!-- at revision 5af1ab1230ade9373777ce05046b2742e01588c6 -->
222
+ - **Maximum Sequence Length:** 128 tokens
223
+ - **Output Dimensionality:** 384 tokens
224
+ - **Similarity Function:** Cosine Similarity
225
+ <!-- - **Training Dataset:** Unknown -->
226
+ <!-- - **Language:** Unknown -->
227
+ <!-- - **License:** Unknown -->
228
+
229
+ ### Model Sources
230
+
231
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
232
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
233
+ - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
234
+
235
+ ### Full Model Architecture
236
+
237
+ ```
238
+ SentenceTransformer(
239
+ (0): Transformer({'max_seq_length': 128, 'do_lower_case': False}) with Transformer model: BertModel
240
+ (1): Pooling({'word_embedding_dimension': 384, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
241
+ )
242
+ ```
243
+
244
+ ## Usage
245
+
246
+ ### Direct Usage (Sentence Transformers)
247
+
248
+ First install the Sentence Transformers library:
249
+
250
+ ```bash
251
+ pip install -U sentence-transformers
252
+ ```
253
+
254
+ Then you can load this model and run inference.
255
+ ```python
256
+ from sentence_transformers import SentenceTransformer
257
+
258
+ # Download from the 🤗 Hub
259
+ model = SentenceTransformer("Mykes/med-MiniLM-L12-4124")
260
+ # Run inference
261
+ sentences = [
262
+ 'У меня сильная боль в спине, боюсь, что это может быть грыжа. К кому мне обратиться за консультацией и лечением? Врач должен быть женщиной, а клиника находиться недалеко от метро Технопарк. \n\n \n\n\n',
263
+ 'кузнецова наталья николаевна; стоимость приема от: 5000 руб (высокая стоимость приема); стаж: 9 лет; пациенты: взрослые; тип приёма: в клинике; клиника: клиникаtemed (темед) на технопарке; технопарк, кленовый бульвар; специальность: невролог, вертебролог; специализация: сдавления нервных корешков и сплетений при, грыжа шейного отдела позвоночника, грыжа позвоночника, обострение грыжи поясничного отдела, грыжа позвоночника поясничного отдела, остеохондроз позвоночника у взрослых, грыжа шморля, защемление грыжи позвоночника, остеохондроз поясничный, грыжа шморля поясничного отдела позвоночника, остеохондроз крестцовый, дорзальная грыжа, межпозвоночная грыжа поясничнокрестцового отдела позвоночника, остеохондроз, грыжа между 4 и 5 позвонком, дегенеративные заболевания позвоночника безоперационное лечение межпозвонковых грыж методом ткачеваепифанова полинейропатии различной этиологии заболевания центральной и периферической нервной системы острый и хронический болевой синдром головные боли различной этимологии специализируется на лечении вертебролог грыжа, секвестрированная грыжа позвоночника поясничного отдела невролог грыжа, дегенерации межпозвоночного диска',
264
+ 'богуш ольга евгеньевна; стоимость приема от: 5000 руб (высокая стоимость приема); стаж: 16 лет; пациенты: взрослые; тип приёма: в клинике; клиника: клиника доктора есиповой; тестовская, шелепиха, улица 1905 года; специальность: врач функциональной диагностики, пульмонолог; специализация: длительного кашля неуточненного характера острой респираторной вирусной инфекции острых и хронических бронхитов вирусных и бактериальных пневмоний плевритов хронической обструктивной болезни легких бронхиальной астмы бронхиолитов бронхоэктазий саркоидоза органов дыхания грибковых заболеваний легких интерстициальных заболеваний легких',
265
+ ]
266
+ embeddings = model.encode(sentences)
267
+ print(embeddings.shape)
268
+ # [3, 384]
269
+
270
+ # Get the similarity scores for the embeddings
271
+ similarities = model.similarity(embeddings, embeddings)
272
+ print(similarities.shape)
273
+ # [3, 3]
274
+ ```
275
+
276
+ <!--
277
+ ### Direct Usage (Transformers)
278
+
279
+ <details><summary>Click to see the direct usage in Transformers</summary>
280
+
281
+ </details>
282
+ -->
283
+
284
+ <!--
285
+ ### Downstream Usage (Sentence Transformers)
286
+
287
+ You can finetune this model on your own dataset.
288
+
289
+ <details><summary>Click to expand</summary>
290
+
291
+ </details>
292
+ -->
293
+
294
+ <!--
295
+ ### Out-of-Scope Use
296
+
297
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
298
+ -->
299
+
300
+ <!--
301
+ ## Bias, Risks and Limitations
302
+
303
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
304
+ -->
305
+
306
+ <!--
307
+ ### Recommendations
308
+
309
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
310
+ -->
311
+
312
+ ## Training Details
313
+
314
+ ### Training Dataset
315
+
316
+ #### Unnamed Dataset
317
+
318
+
319
+ * Size: 3,299 training samples
320
+ * Columns: <code>anchor</code> and <code>positive</code>
321
+ * Approximate statistics based on the first 1000 samples:
322
+ | | anchor | positive |
323
+ |:--------|:------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
324
+ | type | string | string |
325
+ | details | <ul><li>min: 12 tokens</li><li>mean: 39.41 tokens</li><li>max: 128 tokens</li></ul> | <ul><li>min: 74 tokens</li><li>mean: 125.91 tokens</li><li>max: 128 tokens</li></ul> |
326
+ * Samples:
327
+ | anchor | positive |
328
+ |:--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
329
+ | <code>У меня болит живот и тошнит после употребления жирной пищи. К какому специалисту лучше обратиться в районе Народного Ополчения? <br><br><br><br></code> | <code>панёвина лариса викторовна; стоимость приема от: 1500 руб (средняя стоимость приема); стаж: 33 года; пациенты: взрослые; тип приёма: в клинике; клиника: горклиника на октябрьском поле; народное ополчение, октябрьское поле; специальность: гастроэнтеролог, гепатолог; специализация: ещё гепатолог абсцесс печени, амилоидоз кишечника, алкогольная печеночная недостаточность, вирусный гепатит с, болезни печени, гепатит d, гепатит a с печеночной комой, атрезия желчевыводящих путей, гепатобластома, амилоидоз печени, вирусный гепатит при беременности, гепатит b, анизакидоз, ахалазия кардии, вирусный гепатит е, гепатит e, абсцесс селезенки, алкогольный жировой гепатоз печени, вирусный гепатит в, алкогольная болезнь печени, гепатолиенальный, болезнь андерсена, гепатит, аппендикулярные камни, альвеококкоз, анкилостомидоз, аденоматозный полип, алиментарная дистрофия, алкогольный цирроз печени, атрофический гастрит, амебный абсцесс печени, желчнекаменная болезнь дуоденит тифлит колит дивертикулез гепатиты проктит энтероколиты цирроз печени специализируется на лечении гастроэнтеролог абсцесс кишечника, гепатит а, гемолитическая желтуха новорожденных, ахалазия пищевода, вирусный гепатит g, анкилостомоз, ахалазия, аскаридоз, ахлоргидрия, аутоиммунный гепатит, болезнь герса, гепатит с, алиментарная диспепсия, гепатит алкогольный, гепатоз, атрофия сосочков языка, алкогольный фиброз и склероз печени, аномалии развития пищевода</code> |
330
+ | <code>У меня сильные боли в верхней части живота, которые усиливаются после еды. Также появилась тошнота и горечь во рту. Что это может быть и нужно ли мне обратиться к гастроэнтерологу?</code> | <code>вяллов сергей сергеевич; стоимость приема от: 3500 руб (средняя стоимость приема); стаж: 37 лет; звание: профессор; квалификация: врач первой категории; специальность: гастроэнтеролог; пациенты: взрослые; тип приёма: в клинике; клиника: cmd текстильщики; авиамоторная, римская, перово, текстильщики, люблино, печатники, кузьминки; специализация: дивертикулы пищевода грыжа пищеводного отверстия новообразования доброкачественные и злокачественные панкреатит дискинезия желчных путей холецистит специализируется на лечении гастроэнтеролог заболевания желудочнокишечного тракта</code> |
331
+ | <code>У меня появились боли в пояснице и онемение в ногах. Может ли это быть связано с грыжей позвоночника? Какие обследования мне нужно пройти для подтверждения диагноза?</code> | <code>анисимова елена игоревна; стоимость приема от: 7000 руб (высокая стоимость приема); стаж: 25 лет; квалификация: врач высшей категории; учёная степень: кандидат медицинских наук; пациенты: взрослые; тип приёма: в клинике; крылатское, молодежная, кунцевская, щелковская; специальность: невролог, врач функциональной диагностики, нейрофизиолог; специализация: вертебробазилярная недостаточность, болевые синдромы различной л��кализации тазовая боль вегетативные нарушения головная боль головокружения депрессии дистонии лечение гипергидроза лечение фобий мигрень обмороки офисный синдром панические атаки последствия стресса радикулиты тревоги нейрофизиологиеские методы обследования нервной системы вызванные потенциалы транскраниальная магнитная стимуляция исследование болевых систем и систем чувствительности диагностика тазовых нарушений, головокружение, грыжа шморля, атаксия, грыжа, грыжа позвоночника, вегетососудистая дистония, воспалительная миопатия, вялая тетраплегия, бессонница, атеросклероз, тазовой боли и нарушения сексуальной функции с помощью электронейромиографии специализируется на лечении невролог алкогольная полиневропатия нижних конечностей, вегетоневроз, воспалительные полинейропатии, аноксическое поражение головного мозга, алкогольная полинейропатия, вестибулярный нейронит, вялая параплегия, грыжа шморля поясничного отдела позвоночника, астения, головокружение центрального генеза, грыжа между 4 и 5 позвонком</code> |
332
+ * Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
333
+ ```json
334
+ {
335
+ "scale": 20.0,
336
+ "similarity_fct": "cos_sim"
337
+ }
338
+ ```
339
+
340
+ ### Evaluation Dataset
341
+
342
+ #### Unnamed Dataset
343
+
344
+
345
+ * Size: 825 evaluation samples
346
+ * Columns: <code>anchor</code> and <code>positive</code>
347
+ * Approximate statistics based on the first 1000 samples:
348
+ | | anchor | positive |
349
+ |:--------|:------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
350
+ | type | string | string |
351
+ | details | <ul><li>min: 13 tokens</li><li>mean: 38.95 tokens</li><li>max: 128 tokens</li></ul> | <ul><li>min: 85 tokens</li><li>mean: 125.77 tokens</li><li>max: 128 tokens</li></ul> |
352
+ * Samples:
353
+ | anchor | positive |
354
+ |:-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
355
+ | <code>У меня на коже появились бородавки, врач подозревает вирус папилломы человека. Какие препараты от этой инфекции Вы можете порекомендовать?</code> | <code>алиханов андрей халларович; стоимость приема от: 2100 руб (средняя стоимость приема); стаж: 29 лет; квалификация: врач высшей категории; пациенты: взрослые; тип приёма: в клинике; красногвардейская, борисово, пражская, шипиловская; специальность: венеролог, дерматолог, миколог, дерматовенеролог; специализация: атопический дерматит неуточненный, ранний врожденный сифилис, диссеминированный герпес, актиническая гранулема, аллергическая крапивница, гонококковый фарингит, атрофические полосы, белый лишай, бластомикоз, микоз стоп, кольпит генитальный кандидоз специализируется на лечении венеролог аногенитальные бородавки, грибок ногтей, анетодермия швеннингера буцци, белая пьедра, врожденный сифилис, поражение вульвы, атрофодермия пазини пьерини, заболевания органов половой системы вирусной этиологии папилломавирусная инфекция генитальный герпес воспалительные процессы половых органов, герпес, лобомикоз, гонорея, акне вульгарис, гонококковая инфекция, акне средней степени тяжести, стафилококками, акне, актинический кератоз, амилоидоз кожи, гонорея у женщин, висцеральный сифилис, болезни кожи и подкожной клетчатки, остроконечные кондиломы, цистит, вирус папилломы человека, болезни ногтей, бородавки, кандидоз, грибок стопы, сифилис, кишечной палочкой и другими представителями патогенной и условно патогенной микрофлоры уретрит, паховый грибок, алопеция тотальная, атрофия кожи, буллезный эпидермолиз, вирусные бородавки, сифилис ещё дерматолог аденома сальной железы, простой герпес, вызванные стрептококками, гранулема лица, кандидамикоз, паховая гранулема, генитальный герпес, болезни полового члена, венерическая лимфогранулема, зппп, первичный сифилис, пузырчатка эритематозная, актинический ретикулоид, болезни потовых желез, ещё миколог грибок кожи, вторичный сифилис, кондиломы</code> |
356
+ | <code>У меня появились зуд и жжение во влагалище. Могут ли эти симптомы быть связаны с грибковым заболеванием?</code> | <code>ромашкин сергей иванович; стоимость приема от: 1500 руб (средняя стоимость приема); стаж: 11 лет; квалификация: врач высшей категории; пациенты: взрослые; клиника: горклиника в перово; перово, шоссе энтузиастов; специальность: гастроэнтеролог, невролог, дерматовенеролог; специализация: заболевания органов половой системы вирусной этиологии папилломавирусная инфекция генитальный герпес воспалительные процессы половых органов, вызванные стрептококками, цистит, кишечной палочкой и другими представителями патогенной и условно патогенной микрофлоры уретрит, стафилококками, кольпит генитальный кандидоз</code> |
357
+ | <code>У меня проблемы с осанкой, болит спина. Можно ли с помощью ЛФК исправить осанку и снять боль? Какие типы занятий вы проводите для взрослых? Какова стоимость одного занятия?</code> | <code>батухтина эллина раисовна; стоимость приема от: 8500 руб (высокая стоимость приема); стаж: 9 лет; специальность: врач лфк; тип приёма: в клинике; клиника: ао медицина; улица 1905 года, белорусская, смоленская, киевская, проспект мира, маяковская; специализация: проведение лфк групповые и индивидуальные занятия у детей и взрослых с нарушениями опорнодвигательного аппарата составление и проведение индивидуальных занятий реабилитации</code> |
358
+ * Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
359
+ ```json
360
+ {
361
+ "scale": 20.0,
362
+ "similarity_fct": "cos_sim"
363
+ }
364
+ ```
365
+
366
+ ### Training Hyperparameters
367
+ #### Non-Default Hyperparameters
368
+
369
+ - `num_train_epochs`: 100.0
370
+
371
+ #### All Hyperparameters
372
+ <details><summary>Click to expand</summary>
373
+
374
+ - `overwrite_output_dir`: False
375
+ - `do_predict`: False
376
+ - `eval_strategy`: no
377
+ - `prediction_loss_only`: True
378
+ - `per_device_train_batch_size`: 8
379
+ - `per_device_eval_batch_size`: 8
380
+ - `per_gpu_train_batch_size`: None
381
+ - `per_gpu_eval_batch_size`: None
382
+ - `gradient_accumulation_steps`: 1
383
+ - `eval_accumulation_steps`: None
384
+ - `learning_rate`: 5e-05
385
+ - `weight_decay`: 0.0
386
+ - `adam_beta1`: 0.9
387
+ - `adam_beta2`: 0.999
388
+ - `adam_epsilon`: 1e-08
389
+ - `max_grad_norm`: 1.0
390
+ - `num_train_epochs`: 100.0
391
+ - `max_steps`: -1
392
+ - `lr_scheduler_type`: linear
393
+ - `lr_scheduler_kwargs`: {}
394
+ - `warmup_ratio`: 0.0
395
+ - `warmup_steps`: 0
396
+ - `log_level`: passive
397
+ - `log_level_replica`: warning
398
+ - `log_on_each_node`: True
399
+ - `logging_nan_inf_filter`: True
400
+ - `save_safetensors`: True
401
+ - `save_on_each_node`: False
402
+ - `save_only_model`: False
403
+ - `restore_callback_states_from_checkpoint`: False
404
+ - `no_cuda`: False
405
+ - `use_cpu`: False
406
+ - `use_mps_device`: False
407
+ - `seed`: 42
408
+ - `data_seed`: None
409
+ - `jit_mode_eval`: False
410
+ - `use_ipex`: False
411
+ - `bf16`: False
412
+ - `fp16`: False
413
+ - `fp16_opt_level`: O1
414
+ - `half_precision_backend`: auto
415
+ - `bf16_full_eval`: False
416
+ - `fp16_full_eval`: False
417
+ - `tf32`: None
418
+ - `local_rank`: 0
419
+ - `ddp_backend`: None
420
+ - `tpu_num_cores`: None
421
+ - `tpu_metrics_debug`: False
422
+ - `debug`: []
423
+ - `dataloader_drop_last`: False
424
+ - `dataloader_num_workers`: 0
425
+ - `dataloader_prefetch_factor`: None
426
+ - `past_index`: -1
427
+ - `disable_tqdm`: False
428
+ - `remove_unused_columns`: True
429
+ - `label_names`: None
430
+ - `load_best_model_at_end`: False
431
+ - `ignore_data_skip`: False
432
+ - `fsdp`: []
433
+ - `fsdp_min_num_params`: 0
434
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
435
+ - `fsdp_transformer_layer_cls_to_wrap`: None
436
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
437
+ - `deepspeed`: None
438
+ - `label_smoothing_factor`: 0.0
439
+ - `optim`: adamw_torch
440
+ - `optim_args`: None
441
+ - `adafactor`: False
442
+ - `group_by_length`: False
443
+ - `length_column_name`: length
444
+ - `ddp_find_unused_parameters`: None
445
+ - `ddp_bucket_cap_mb`: None
446
+ - `ddp_broadcast_buffers`: False
447
+ - `dataloader_pin_memory`: True
448
+ - `dataloader_persistent_workers`: False
449
+ - `skip_memory_metrics`: True
450
+ - `use_legacy_prediction_loop`: False
451
+ - `push_to_hub`: False
452
+ - `resume_from_checkpoint`: None
453
+ - `hub_model_id`: None
454
+ - `hub_strategy`: every_save
455
+ - `hub_private_repo`: False
456
+ - `hub_always_push`: False
457
+ - `gradient_checkpointing`: False
458
+ - `gradient_checkpointing_kwargs`: None
459
+ - `include_inputs_for_metrics`: False
460
+ - `eval_do_concat_batches`: True
461
+ - `fp16_backend`: auto
462
+ - `push_to_hub_model_id`: None
463
+ - `push_to_hub_organization`: None
464
+ - `mp_parameters`:
465
+ - `auto_find_batch_size`: False
466
+ - `full_determinism`: False
467
+ - `torchdynamo`: None
468
+ - `ray_scope`: last
469
+ - `ddp_timeout`: 1800
470
+ - `torch_compile`: False
471
+ - `torch_compile_backend`: None
472
+ - `torch_compile_mode`: None
473
+ - `dispatch_batches`: None
474
+ - `split_batches`: None
475
+ - `include_tokens_per_second`: False
476
+ - `include_num_input_tokens_seen`: False
477
+ - `neftune_noise_alpha`: None
478
+ - `optim_target_modules`: None
479
+ - `batch_eval_metrics`: False
480
+ - `eval_on_start`: False
481
+ - `batch_sampler`: batch_sampler
482
+ - `multi_dataset_batch_sampler`: proportional
483
+
484
+ </details>
485
+
486
+ ### Training Logs
487
+ | Epoch | Step | Training Loss |
488
+ |:-------:|:-----:|:-------------:|
489
+ | 1.2107 | 500 | 0.2302 |
490
+ | 2.4213 | 1000 | 0.1409 |
491
+ | 3.6320 | 1500 | 0.0976 |
492
+ | 4.8426 | 2000 | 0.0792 |
493
+ | 6.0533 | 2500 | 0.085 |
494
+ | 7.2639 | 3000 | 0.0677 |
495
+ | 8.4746 | 3500 | 0.0563 |
496
+ | 9.6852 | 4000 | 0.0562 |
497
+ | 10.8959 | 4500 | 0.0384 |
498
+ | 12.1065 | 5000 | 0.0407 |
499
+ | 13.3172 | 5500 | 0.043 |
500
+ | 14.5278 | 6000 | 0.0318 |
501
+ | 15.7385 | 6500 | 0.031 |
502
+ | 16.9492 | 7000 | 0.027 |
503
+ | 18.1598 | 7500 | 0.02 |
504
+ | 19.3705 | 8000 | 0.0209 |
505
+ | 20.5811 | 8500 | 0.0221 |
506
+ | 21.7918 | 9000 | 0.0167 |
507
+ | 23.0024 | 9500 | 0.0207 |
508
+ | 24.2131 | 10000 | 0.0194 |
509
+
510
+
511
+ ### Framework Versions
512
+ - Python: 3.10.12
513
+ - Sentence Transformers: 3.0.1
514
+ - Transformers: 4.42.4
515
+ - PyTorch: 2.4.0+cu121
516
+ - Accelerate: 0.32.1
517
+ - Datasets: 2.21.0
518
+ - Tokenizers: 0.19.1
519
+
520
+ ## Citation
521
+
522
+ ### BibTeX
523
+
524
+ #### Sentence Transformers
525
+ ```bibtex
526
+ @inproceedings{reimers-2019-sentence-bert,
527
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
528
+ author = "Reimers, Nils and Gurevych, Iryna",
529
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
530
+ month = "11",
531
+ year = "2019",
532
+ publisher = "Association for Computational Linguistics",
533
+ url = "https://arxiv.org/abs/1908.10084",
534
+ }
535
+ ```
536
+
537
+ #### MultipleNegativesRankingLoss
538
+ ```bibtex
539
+ @misc{henderson2017efficient,
540
+ title={Efficient Natural Language Response Suggestion for Smart Reply},
541
+ author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
542
+ year={2017},
543
+ eprint={1705.00652},
544
+ archivePrefix={arXiv},
545
+ primaryClass={cs.CL}
546
+ }
547
+ ```
548
+
549
+ <!--
550
+ ## Glossary
551
+
552
+ *Clearly define terms in order to be accessible across audiences.*
553
+ -->
554
+
555
+ <!--
556
+ ## Model Card Authors
557
+
558
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
559
+ -->
560
+
561
+ <!--
562
+ ## Model Card Contact
563
+
564
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
565
+ -->
config.json ADDED
@@ -0,0 +1,26 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "_name_or_path": "Mykes/med-MiniLM-L12-3059",
3
+ "architectures": [
4
+ "BertModel"
5
+ ],
6
+ "attention_probs_dropout_prob": 0.1,
7
+ "classifier_dropout": null,
8
+ "gradient_checkpointing": false,
9
+ "hidden_act": "gelu",
10
+ "hidden_dropout_prob": 0.1,
11
+ "hidden_size": 384,
12
+ "initializer_range": 0.02,
13
+ "intermediate_size": 1536,
14
+ "layer_norm_eps": 1e-12,
15
+ "max_position_embeddings": 512,
16
+ "model_type": "bert",
17
+ "num_attention_heads": 12,
18
+ "num_hidden_layers": 12,
19
+ "pad_token_id": 0,
20
+ "position_embedding_type": "absolute",
21
+ "torch_dtype": "float32",
22
+ "transformers_version": "4.42.4",
23
+ "type_vocab_size": 2,
24
+ "use_cache": true,
25
+ "vocab_size": 250037
26
+ }
config_sentence_transformers.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "__version__": {
3
+ "sentence_transformers": "3.0.1",
4
+ "transformers": "4.42.4",
5
+ "pytorch": "2.4.0+cu121"
6
+ },
7
+ "prompts": {},
8
+ "default_prompt_name": null,
9
+ "similarity_fn_name": null
10
+ }
model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:d4deee9cce9074a680ca5b7776992e2a6a18cb74f1d26e7e88e152de0942e4ae
3
+ size 470637416
modules.json ADDED
@@ -0,0 +1,14 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "",
6
+ "type": "sentence_transformers.models.Transformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_Pooling",
12
+ "type": "sentence_transformers.models.Pooling"
13
+ }
14
+ ]
sentence_bert_config.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "max_seq_length": 128,
3
+ "do_lower_case": false
4
+ }
special_tokens_map.json ADDED
@@ -0,0 +1,51 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "bos_token": {
3
+ "content": "<s>",
4
+ "lstrip": false,
5
+ "normalized": false,
6
+ "rstrip": false,
7
+ "single_word": false
8
+ },
9
+ "cls_token": {
10
+ "content": "<s>",
11
+ "lstrip": false,
12
+ "normalized": false,
13
+ "rstrip": false,
14
+ "single_word": false
15
+ },
16
+ "eos_token": {
17
+ "content": "</s>",
18
+ "lstrip": false,
19
+ "normalized": false,
20
+ "rstrip": false,
21
+ "single_word": false
22
+ },
23
+ "mask_token": {
24
+ "content": "<mask>",
25
+ "lstrip": true,
26
+ "normalized": false,
27
+ "rstrip": false,
28
+ "single_word": false
29
+ },
30
+ "pad_token": {
31
+ "content": "<pad>",
32
+ "lstrip": false,
33
+ "normalized": false,
34
+ "rstrip": false,
35
+ "single_word": false
36
+ },
37
+ "sep_token": {
38
+ "content": "</s>",
39
+ "lstrip": false,
40
+ "normalized": false,
41
+ "rstrip": false,
42
+ "single_word": false
43
+ },
44
+ "unk_token": {
45
+ "content": "<unk>",
46
+ "lstrip": false,
47
+ "normalized": false,
48
+ "rstrip": false,
49
+ "single_word": false
50
+ }
51
+ }
tokenizer.json ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:cad551d5600a84242d0973327029452a1e3672ba6313c2a3c3d69c4310e12719
3
+ size 17082987
tokenizer_config.json ADDED
@@ -0,0 +1,64 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "added_tokens_decoder": {
3
+ "0": {
4
+ "content": "<s>",
5
+ "lstrip": false,
6
+ "normalized": false,
7
+ "rstrip": false,
8
+ "single_word": false,
9
+ "special": true
10
+ },
11
+ "1": {
12
+ "content": "<pad>",
13
+ "lstrip": false,
14
+ "normalized": false,
15
+ "rstrip": false,
16
+ "single_word": false,
17
+ "special": true
18
+ },
19
+ "2": {
20
+ "content": "</s>",
21
+ "lstrip": false,
22
+ "normalized": false,
23
+ "rstrip": false,
24
+ "single_word": false,
25
+ "special": true
26
+ },
27
+ "3": {
28
+ "content": "<unk>",
29
+ "lstrip": false,
30
+ "normalized": false,
31
+ "rstrip": false,
32
+ "single_word": false,
33
+ "special": true
34
+ },
35
+ "250001": {
36
+ "content": "<mask>",
37
+ "lstrip": true,
38
+ "normalized": false,
39
+ "rstrip": false,
40
+ "single_word": false,
41
+ "special": true
42
+ }
43
+ },
44
+ "bos_token": "<s>",
45
+ "clean_up_tokenization_spaces": true,
46
+ "cls_token": "<s>",
47
+ "do_lower_case": true,
48
+ "eos_token": "</s>",
49
+ "mask_token": "<mask>",
50
+ "max_length": 128,
51
+ "model_max_length": 128,
52
+ "pad_to_multiple_of": null,
53
+ "pad_token": "<pad>",
54
+ "pad_token_type_id": 0,
55
+ "padding_side": "right",
56
+ "sep_token": "</s>",
57
+ "stride": 0,
58
+ "strip_accents": null,
59
+ "tokenize_chinese_chars": true,
60
+ "tokenizer_class": "BertTokenizer",
61
+ "truncation_side": "right",
62
+ "truncation_strategy": "longest_first",
63
+ "unk_token": "<unk>"
64
+ }
unigram.json ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:da145b5e7700ae40f16691ec32a0b1fdc1ee3298db22a31ea55f57a966c4a65d
3
+ size 14763260