Mykes commited on
Commit
5af1ab1
1 Parent(s): 1a51d40

Add new SentenceTransformer model.

Browse files
.gitattributes CHANGED
@@ -33,3 +33,5 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
 
 
 
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
36
+ tokenizer.json filter=lfs diff=lfs merge=lfs -text
37
+ unigram.json filter=lfs diff=lfs merge=lfs -text
1_Pooling/config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "word_embedding_dimension": 384,
3
+ "pooling_mode_cls_token": false,
4
+ "pooling_mode_mean_tokens": true,
5
+ "pooling_mode_max_tokens": false,
6
+ "pooling_mode_mean_sqrt_len_tokens": false,
7
+ "pooling_mode_weightedmean_tokens": false,
8
+ "pooling_mode_lasttoken": false,
9
+ "include_prompt": true
10
+ }
README.md ADDED
@@ -0,0 +1,545 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ base_model: sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2
3
+ datasets: []
4
+ language: []
5
+ library_name: sentence-transformers
6
+ pipeline_tag: sentence-similarity
7
+ tags:
8
+ - sentence-transformers
9
+ - sentence-similarity
10
+ - feature-extraction
11
+ - generated_from_trainer
12
+ - dataset_size:2447
13
+ - loss:MultipleNegativesRankingLoss
14
+ widget:
15
+ - source_sentence: Пожалуйста, предоставьте документ, чтобы я мог сгенерировать запрос
16
+ пациента.
17
+ sentences:
18
+ - 'кузьмин вячеслав иванович; стоимость приема от: 1770 руб (средняя стоимость приема);
19
+ стаж: 50 лет; квалификация: врач высшей категории; учёная степень: доктор медицинских
20
+ наук; пациенты: взрослые; тип приёма: в клинике; клиника: клиника неврологии и
21
+ ортопедии здравклиник на октябрьской; октябрьская, добрынинская; специальность:
22
+ ортопед, травматолог, артролог; специализация: вальгусная деформация, воспалительные
23
+ спондилопатии, грыжа беккера под коленом, грыжа шморля, анкилоз, дисковидный мениск,
24
+ бурсит, околосуставное и внутрисуставное введение лекарственных препаратов забор
25
+ пункции сустава или околосуставной сумки специализируется на лечении артролог
26
+ бурсит плеча, бурсит плеча, грыжа, первичный гонартроз ортопед адгезивный капсулит,
27
+ артропатия, бурсит локтевого сустава, латеральный эпикондилит, контрактура, первичный
28
+ генерализованный остеоартроз, вторичные коксартрозы, контрактура сустава, декомпрессионная
29
+ болезнь, гемартроз, идиопатический остеопороз, коксартроз 2 степени, нестабильность
30
+ коленного, коксартроз 3 степени, бурсит коленного сустава, киста тазобедренного
31
+ сустава, грыжа шморля ещё травматолог артроз неуточненный, вторичный гонартроз,
32
+ гонартроз неуточненный, болтающийся сустав, кальцифицирующий тендинит, бурсит
33
+ большого вертела, киста синовиальной сумки, бурситы бедра, варусная деформация,
34
+ артроз неуточненный, внутренние поражения колена, мышечная деформация, артроз
35
+ первого запястно пястного сустава, бурсит локтевого отростка, вторичный артроз
36
+ суставов'
37
+ - 'тихонова елена николаевна; стоимость приема от: 1930 руб (средняя стоимость приема);
38
+ стаж: 39 лет; квалификация: врач высшей категории; тип приёма: в клинике; клиника:
39
+ медцентр он клиник на парке культуры; смоленская, парк культуры; специальность:
40
+ акушер, гинеколог; специализация: лазерное омоложение вульвы и влагалища, удаление
41
+ полипов, консультирование по вопросам планирования беременности, в том числе осложненной
42
+ консультирование по вопросам грудного вскармливания консультирование по вопросам
43
+ контрацепции введение и удаление вмс медикаментозное прерывание беременности лечение
44
+ различных форм эндометриоза и миомы матки обследование и лечение эрозии и дисплазии
45
+ шейки матки кольпоскопия воспалительных заболевания женских половых органов проведение
46
+ раздельного лечебнодиагностического выскабливания матки, эхогистероскопия ведение
47
+ беременности с 8 недель, зачатия, климактерические состояния радиохирургическое
48
+ лечение патологии шейки матки выполнение интимной контурной пластики филлеры,
49
+ удаление полипов матки и цервикального канала лечение абсцессов и кист бартолиновой
50
+ железы, кондилом и папиллом гинекологическая эндокринология нарушение менструального
51
+ цикла, невынашивания беременности, вынашивания ребенка лечение бесплодия'
52
+ - 'самойленко виктория ивановна; стоимость приема от: 2300 руб (средняя стоимость
53
+ приема); стаж: 23 года; квалификация: врач первой категории; специальность: врач
54
+ функциональной диагностики; пациенты: взрослые; клиника: медицинский центр на
55
+ ботанической; бибирево, окружная, владыкино, дегунино; специализация: нервной
56
+ системы электроэнцефалография, реоэнцефалография, шеи и конечностей смада, пикфлоуметрия
57
+ и т д, эхоэнцефалография и др сердечнососудистой системы экг, холтера и тд дыхательной
58
+ системы фвд, эхокг, пульсоксиметрия, узи сосудов головы'
59
+ - source_sentence: Мне поставили диагноз герпес. Какие препараты от него можно использовать,
60
+ чтобы быстрее вылечиться? Врач специализируется на лечении вирусных заболеваний
61
+ кожи, поэтому этот вопрос ему будет уместен.
62
+ sentences:
63
+ - 'грибанов никита валерьевич; стоимость приема от: 7500 руб (высокая стоимость
64
+ приема); стаж: 13 лет; квалификация: врач второй категории; специальность: дерматовенеролог;
65
+ пациенты: взрослые; тип приёма: в клинике; клиника: объединенная больница с поликлиникой
66
+ управления делами президента рф; воробьевы горы, ломоносовский проспект; специализация:
67
+ контактный, лишаи различных типов псориаз дерматит аллергический, нейродермит
68
+ акне угрей экзема розацеа себорея вирусных заболеваний кожи паппиломы, бородавки,
69
+ атопический, герпес микозов грибковых заболеваний кожи'
70
+ - 'щербакова виктория вениаминовна; стоимость приема от: 1610 руб (средняя стоимость
71
+ приема); стаж: 25 лет; пациенты: взрослые; тип приёма: в клинике; авиамоторная,
72
+ проспект вернадского, университет; специальность: венеролог, дерматолог, дерматовенеролог;
73
+ специализация: себорейный дерматит псориаз экзема микозы розовый, родинки фурункулез
74
+ абсцессы псевдомикоз паховая эритразма, аллергический, бородавки, отрубевидный
75
+ лишай папилломы, кондиломы'
76
+ - 'кучейник сергей григорьевич; стоимость приема от: 1770 руб (средняя стоимость
77
+ приема); стаж: 43 года; квалификация: врач высшей категории; учёная степень: кандидат
78
+ медицинских наук; пациенты: взрослые; митино, октябрьская, пятницкое шоссе, добрынинская;
79
+ специальность: мануальный терапевт, невролог, рефлексотерапевт, вертебролог, вегетолог;
80
+ специализация: невроза, на диагностике и лечении патологий и нозологий неврологического
81
+ профиля, эпилепсии, нейропатии, дегенеративнодистрофических поражений позвоночника
82
+ нарушений работы внутренних органов благодаря воздействию на отдельные точки тела
83
+ мануальным путем, вегетососудистой дистонии всд, невралгии, склероза, физиотерапевтическими
84
+ методами владеет следующими методиками, лечении пациентов с паркинсонизмом и болезнью
85
+ альцгеймера мигрени'
86
+ - source_sentence: Мне поставили диагноз ревматоидный артрит. Какие препараты обычно
87
+ назначают при этом заболевании? Какой препарат, по Вашему опыту, наиболее эффективен? Есть
88
+ ли какие-то альтернативы стандартной терапии?
89
+ sentences:
90
+ - 'мякишев андрей геннадьевич; стоимость приема от: 1960 руб (средняя стоимость
91
+ приема); стаж: 26 лет; квалификация: врач высшей категории; учёная степень: кандидат
92
+ медицинских наук; пациенты: взрослые; тип приёма: в клинике; клиника: первая клиника
93
+ измайлово доктора бандуриной; первомайская; специальность: андролог, венеролог,
94
+ уролог; специализация: азооспермия, бластомикоз, внутрибольничные инфекции, атрофия
95
+ простаты, аспермия, застойный простатит, нарушение полового ещё венеролог болезни
96
+ полового члена, водянка, кавернит, болезни почек и мочеточника, микропенис, баланопостит,
97
+ гипоплазия яичка и мошонки, вирусные заболевания, киста предстательной железы
98
+ у мужчин, агенезия мочеточника, аденома, везикулит, аномалия мочевого протока,
99
+ герминогенные опухоли, гормональные проблемы эректильной функции и влечения репродуктология
100
+ проблемы зачатия ребенка, воспалительные заболевания мужского полового органа,
101
+ варикозное расширение вен мошонки, воспаление предстательной железы, аденома простаты,
102
+ алкаптонурия, анорхизм, воспалительные заболевания полового члена, импотенция,
103
+ атрофия яичек, бесплодие у мужчин, дифаллия, репродуктивная мужская система специализируется
104
+ на лечении андролог аденома, болезнь пейрони, атония мочевого пузыря, адреногенитальные
105
+ расстройства, асимптоматический хронический простатит, хламидиоз у мужчин, язва
106
+ полового члена уролог абсцесс предстательной железы, баланит, гидроцеле и сперматоцеле,
107
+ урология мочевыделительный тракт андрология мужская половая система, болезни полового
108
+ члена, болезнь предстательной железы, гиперфункция яичек, мужское бесплодие, зппп,
109
+ аденома предстательной железы, болезни мочевой системы, апоплексия яичника'
110
+ - 'форсюк дмитрий анатольевич; стоимость приема от: 1883 руб (средняя стоимость
111
+ приема); стаж: 16 лет; квалификация: врач высшей категории; учёная степень: кандидат
112
+ медицинских наук; пациенты: взрослые; тип приёма: в клинике; клиника: медицинский
113
+ центр к-медицина; вднх, алексеевская, рижская; специальность: ревматолог, артролог,
114
+ вертебролог, терапевт; специализация: амбулаторным приемом пациентов ревматологического
115
+ профиля артрология и системные ревматические заболевания диагностикой и лечением
116
+ ревматологических заболеваний согласно современным стандартам лечением проблем
117
+ ревмато��огических заболеваний'
118
+ - 'валуйская юлия владимировна; стоимость приема от: 3000 руб (средняя стоимость
119
+ приема); стаж: 10 лет; пациенты: взрослые; тип приёма: в клинике; римская, крестьянская
120
+ застава, перово, пролетарская, озёрная; специальность: невролог, сомнолог, вертебролог;
121
+ специализация: геморрагический инсульт бессонница менингит, опухоли в головном
122
+ мозг, ущемление спинномозгового нерва, рассеянный склероз болезнь паркинсона,
123
+ повышенное внутричерепное давление миопатия рак позвоночника, миелит, невралгия,
124
+ радикулит, полиомиелит мигрень, спондилёз ишемический, остеохондроз межпозвоночная
125
+ грыжа, альцгеймера гидроцефалия'
126
+ - source_sentence: "У меня болит спина и отдает в ногу. К какому врачу мне обратиться\
127
+ \ в районе Отрадное? \n\n\n\n"
128
+ sentences:
129
+ - 'македонский евгений витальевич; стоимость приема от: 1080 руб (низкая стоимость
130
+ приема); стаж: 10 лет; квалификация: врач высшей категории; учёная степень: кандидат
131
+ медицинских наук; пациенты: взрослые; тип приёма: в клинике; клиника: клиника
132
+ неврологии и ортопедии здравклиник в отрадном; отрадное, владыкино; специальность:
133
+ ортопед, вертебролог, травматолог, артролог; специализация: вальгусная деформация,
134
+ деформация пальцев, болезни костно мышечной системы и соединительной ткани, артрит
135
+ при болезни лайма, первичный гонартроз, грыжа позвоночника поясничного отдела,
136
+ грыжа шморля, артроз, анкилоз, дисковидный мениск, адгезивный капсулит, паравертебральные
137
+ включительно введение протезов синовиальной жидкости prpтерапия плазмолифтинг
138
+ с использованием ультразвуковой навигации специализируется на лечении артролог
139
+ артрит, бурсит, люмбаго с ишиасом, бурсит плеча, артроз коленного сустава, асфиксия,
140
+ артропатия, грыжа позвоночника, бурсит локтевого сустава, латеральный эпикондилит,
141
+ поражения суставов вертебролог грыжа, спондилез поясничнокрестцового отдела позвоночника,
142
+ контрактура, первичный генерализованный остеоартроз, вторичные коксартрозы, контрактура
143
+ сустава, поражение костей и суставных хрящей, спондилолиз, декомпрессионная болезнь,
144
+ гемартроз, энтезопатия позвоночника ортопед hallux valgus, коксартроз 2 степени,
145
+ грыжа шейного отдела позвоночника, коксартроз 3 степени, бурсит коленного сустава,
146
+ спондилез грудного отдела позвоночника, вторичный гонартроз, гонартроз неуточненный,
147
+ болтающийся сустав, смещение позвонков, болезни костей, спондилез, бурсит большого
148
+ вертела, бурситы бедра, ещё травматолог абдоминальная травма, стеноз позвоночного
149
+ канала поясничного отдела, артроз неуточненный, ахиллобурсит, варусная деформация,
150
+ обострение грыжи поясничного отдела, внутренние поражения колена, сколиоз, артроз
151
+ первого запястно пястного сустава, различные виды внутрисуставных инъекций лекарственных
152
+ препаратов, грыжа шморля поясничного отдела позвоночника, бурсит локтевого отростка,
153
+ грыжа между 4 и 5 позвонком, вторичный артроз суставов'
154
+ - 'дроздовская ника вадимовна; стоимость приема от: 5900 руб (высокая стоимость
155
+ приема); стаж: 23 года; квалификация: врач высшей категории; специальность: гастроэнтеролог;
156
+ тип приёма: в клинике; клиника: семейная на полежаевской; хорошевская, полежаевская,
157
+ хорошево; специализация: запор, жировой гепатоз, диарея, аскаридоз, альвеококкоз,
158
+ безоар, алиментарная дистрофия, алиментарная диспепсия, заболевания желудочнокишечного
159
+ тракта, гастрит язва желудка и двенадцатиперстной кишки дисбактериоз гепатит диарея
160
+ понос панкреатит холецистит эзофагит колит запор специализируется на лечении гастроэнтеролог
161
+ аденоматозный полип, ахалазия'
162
+ - 'шерашов виктор семенович; стоимость приема от: 5000 руб (высокая стоимость приема);
163
+ стаж: 42 года; звание: доцент; квалификация: врач высшей категории; учёная степень:
164
+ доктор медицинских наук; пациенты: взрослые; тип приёма: в клинике; водный стадион,
165
+ крестьянская застава, марксистская, таганская; специальность: кардиолог, врач
166
+ функциональной диагностики; специализация: внутренние болезни, клиническая эпидемиология,
167
+ функциональная диагностика, клиническая электрофизиология, клиникостатистические
168
+ методы в кардиологии, кардиология'
169
+ - source_sentence: Мне поставили диагноз аритмия. Врач назначил мне препарат Соталекс. Пожалуйста,
170
+ расскажите подробнее о этом препарате - как он действует, есть ли у него побочные
171
+ эффекты и какие противопоказания? Могу ли я заниматься спортом во время приема
172
+ Соталекса?
173
+ sentences:
174
+ - 'хабачирова марьяна салимовна; стоимость приема от: 3000 руб (средняя стоимость
175
+ приема); пациенты: взрослые; тип приёма: в клинике; клиника: многопрофильная клиника
176
+ кеамед; серп и молот, авиамоторная; специальность: кардиолог, врач функциональной
177
+ диагностики; специализация: аритмия тахикардия, брадикардия инфаркт и последствия
178
+ инфаркта гипертония атеросклероз стенокардия грудная жаба пороки сердца сердечная
179
+ недостаточность основными направлениями в работе является оценка состояния'
180
+ - 'стукова наталья юрьевна; стоимость приема от: 6000 руб (высокая стоимость приема);
181
+ стаж: 16 лет; учёная степень: кандидат медицинских наук; специальность: гастроэнтеролог;
182
+ пациенты: взрослые; тип приёма: в клинике; клиника: клиника фомина многопрофильный
183
+ медицинский центр; раменки, ломоносовский проспект, мичуринский проспект; специализация:
184
+ гастрит язва желудка и двенадцатиперстной кишки дисбактериоз гепатит диарея понос
185
+ панкреатит холецистит эзофагит колит запор направления диагностики'
186
+ - 'байрамукова мариям хасановна; стоимость приема от: 2700 руб (средняя стоимость
187
+ приема); стаж: 33 года; квалификация: врач высшей категории; учёная степень: кандидат
188
+ медицинских на��к; пациенты: взрослые; шаболовская, ленинский проспект, арбатская,
189
+ смоленская, площадь гагарина; специальность: кардиолог, врач функциональной диагностики;
190
+ специализация: тредмилтест, суточное мониторирование экг и ад, экг, фвд, стресстесты
191
+ вэм, бодиплетизмография определение скорости пульсовой волнылодыжечноплечевогоиндекса
192
+ расчет биологического возраста определение вариабельности ритма сердца, эхокг'
193
+ ---
194
+
195
+ # SentenceTransformer based on sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2
196
+
197
+ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2](https://huggingface.co/sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2). It maps sentences & paragraphs to a 384-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
198
+
199
+ ## Model Details
200
+
201
+ ### Model Description
202
+ - **Model Type:** Sentence Transformer
203
+ - **Base model:** [sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2](https://huggingface.co/sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2) <!-- at revision bf3bf13ab40c3157080a7ab344c831b9ad18b5eb -->
204
+ - **Maximum Sequence Length:** 128 tokens
205
+ - **Output Dimensionality:** 384 tokens
206
+ - **Similarity Function:** Cosine Similarity
207
+ <!-- - **Training Dataset:** Unknown -->
208
+ <!-- - **Language:** Unknown -->
209
+ <!-- - **License:** Unknown -->
210
+
211
+ ### Model Sources
212
+
213
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
214
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
215
+ - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
216
+
217
+ ### Full Model Architecture
218
+
219
+ ```
220
+ SentenceTransformer(
221
+ (0): Transformer({'max_seq_length': 128, 'do_lower_case': False}) with Transformer model: BertModel
222
+ (1): Pooling({'word_embedding_dimension': 384, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
223
+ )
224
+ ```
225
+
226
+ ## Usage
227
+
228
+ ### Direct Usage (Sentence Transformers)
229
+
230
+ First install the Sentence Transformers library:
231
+
232
+ ```bash
233
+ pip install -U sentence-transformers
234
+ ```
235
+
236
+ Then you can load this model and run inference.
237
+ ```python
238
+ from sentence_transformers import SentenceTransformer
239
+
240
+ # Download from the 🤗 Hub
241
+ model = SentenceTransformer("Mykes/med-MiniLM-L12-3059")
242
+ # Run inference
243
+ sentences = [
244
+ 'Мне поставили диагноз аритмия. Врач назначил мне препарат Соталекс. Пожалуйста, расскажите подробнее о этом препарате - как он действует, есть ли у него побочные эффекты и какие противопоказания? Могу ли я заниматься спортом во время приема Соталекса?',
245
+ 'байрамукова мариям хасановна; стоимость приема от: 2700 руб (средняя стоимость приема); стаж: 33 года; квалификация: врач высшей категории; учёная степень: кандидат медицинских наук; пациенты: взрослые; шаболовская, ленинский проспект, арбатская, смоленская, площадь гагарина; специальность: кардиолог, врач функциональной диагностики; специализация: тредмилтест, суточное мониторирование экг и ад, экг, фвд, стресстесты вэм, бодиплетизмография определение скорости пульсовой волнылодыжечноплечевогоиндекса расчет биологического возраста определение вариабельности ритма сердца, эхокг',
246
+ 'хабачирова марьяна салимовна; стоимость приема от: 3000 руб (средняя стоимость приема); пациенты: взрослые; тип приёма: в клинике; клиника: многопрофильная клиника кеамед; серп и молот, авиамоторная; специальность: кардиолог, врач функциональной диагностики; специализация: аритмия тахикардия, брадикардия инфаркт и последствия инфаркта гипертония атеросклероз стенокардия грудная жаба пороки сердца сердечная недостаточность основными направлениями в работе является оценка состояния',
247
+ ]
248
+ embeddings = model.encode(sentences)
249
+ print(embeddings.shape)
250
+ # [3, 384]
251
+
252
+ # Get the similarity scores for the embeddings
253
+ similarities = model.similarity(embeddings, embeddings)
254
+ print(similarities.shape)
255
+ # [3, 3]
256
+ ```
257
+
258
+ <!--
259
+ ### Direct Usage (Transformers)
260
+
261
+ <details><summary>Click to see the direct usage in Transformers</summary>
262
+
263
+ </details>
264
+ -->
265
+
266
+ <!--
267
+ ### Downstream Usage (Sentence Transformers)
268
+
269
+ You can finetune this model on your own dataset.
270
+
271
+ <details><summary>Click to expand</summary>
272
+
273
+ </details>
274
+ -->
275
+
276
+ <!--
277
+ ### Out-of-Scope Use
278
+
279
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
280
+ -->
281
+
282
+ <!--
283
+ ## Bias, Risks and Limitations
284
+
285
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
286
+ -->
287
+
288
+ <!--
289
+ ### Recommendations
290
+
291
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
292
+ -->
293
+
294
+ ## Training Details
295
+
296
+ ### Training Dataset
297
+
298
+ #### Unnamed Dataset
299
+
300
+
301
+ * Size: 2,447 training samples
302
+ * Columns: <code>anchor</code> and <code>positive</code>
303
+ * Approximate statistics based on the first 1000 samples:
304
+ | | anchor | positive |
305
+ |:--------|:------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
306
+ | type | string | string |
307
+ | details | <ul><li>min: 12 tokens</li><li>mean: 39.83 tokens</li><li>max: 128 tokens</li></ul> | <ul><li>min: 74 tokens</li><li>mean: 125.95 tokens</li><li>max: 128 tokens</li></ul> |
308
+ * Samples:
309
+ | anchor | positive |
310
+ |:----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
311
+ | <code>У меня участились сердцебиение и головокружения. Может ли это быть связано с нарушением ритма сердца?</code> | <code>соколова светлана олеговна; стоимость приема от: 3360 руб (средняя стоимость приема); стаж: 26 лет; учёная степень: кандидат медицинских наук; пациенты: взрослые; тип приёма: в клинике; клиника: медцентр столица на арбате; кропоткинская, смоленская; специальность: кардиолог, врач функциональной диагностики, аритмолог; специализация: хронической сердечной недостаточности подбор терапии, хирургическое лечение владение навыками функциональной диагностики, нарушений ритма и проводимости сердца, направление на высокотехнологичные методы лечения, ишемической болезни сердца, артериальной гипертонии, ведение пациентов</code> |
312
+ | <code>Мне поставили диагноз гастрит. Какой препарат мне лучше принимать: Омез или Гастал? Есть ли у этих препаратов какие-то побочные эффекты? Можно ли их принимать одновременно с другими лекарствами, например, от давления?</code> | <code>алланазарова юлдуз худайбергановна; стоимость приема от: 2500 руб (средняя стоимость приема); стаж: 24 года; квалификация: врач высшей категории; пациенты: взрослые; клиника: московский доктор в бутово; бульвар дмитрия донского, улица старокачаловская; специальность: терапевт, гастроэнтеролог; специализация: грипп, внутрибольничные инфекции, ларингит у беременных, бронхолегочные заболевания, отравление стрихнином, отравление мышьяком, орви с кишечным синдромом у взрослых, гаргоилизм, бронхит, эрготизм терапевт аденовирус, одышка, дислипидемии, опухоль внутрибрюшных лимфоузлов, бронхоэктатическая болезнь, вирусные заболевания, бронхиолит, отравление аконитом, лихорадка, стенокардия, диабет специализируется на лечении гастроэнтеролог латиризм, нанофиетоз, отравление красавкой, хсн, орви у пожилых людей, орви при беременности, вирусные инфекции, орви, гипотония, отравление вехом ядовитым, псевдомембранозный энтероколит, дефицит цинка, токсическая гепатопатия, вирусный менингит, отравление магнием, ветрянка, ларингит у взрослых, заболевания мочевыводящих путей нефриты орви заболевания желудочнокишечного тракта эндокринные заболевания ожирение, аденовирусный менингит, стратификация и коррекция факторов риска развития сердечнососудистых осложнений заболевания органов дыхания, острая респираторная инфекция нижних, гриппозный менингит, отравление таллием, латиризм, заболевания сердечнососудистой системы гипертоническая болезнь</code> |
313
+ | <code>У меня проблемы с пищеварением и я подозреваю у себя лактозную непереносимость. К какому врачу мне лучше обратиться - гастроэнтерологу или терапевту? Врач должен быть женщиной, прием средний по стоимости, а клиника находиться рядом с метро Ховрино. <br></code> | <code>аськина екатерина сергеевна; стоимость приема от: 2500 руб (средняя стоимость приема); стаж: 13 лет; пациенты: взрослые; тип приёма: в клинике; клиника: бест клиник на беломорской / речном вокзале; ховрино, речной вокзал, беломорская; специальность: гастроэнтеролог, терапевт; специализация: внутрибольничные инфекции, лекарственные поражения печени, бронхолегочные заболевания, дисбактериоз у беременных, дыхательной системы бронхиты, гиповитаминоз витамина в2, бронхит, гиповитаминоз d, бридость, хобл, пневмония, бронхоэктатическая болезнь, вирусные заболевания, бронхиолит, болезни лимфатических сосудов и лимфатических узлов, болезни слюнных желез, аденовирусная инфекция, ишемическая болезнь сердца заболевания суставов различные артрозы специализируется на лечении гастроэнтеролог гипервитаминоз а, бронхопневмония, воспалительный инфильтрат, врожденные аномалии, аутоиммунные заболевания, вирусные инфекции, гименоптеризм, псевдомембранозный энтероколит, анизоцитоз, ветрянка, болезнь лимфатических сосудов и лимфатических узлов неуточненная, вирусные болезни, диарея путешественников, вирусный фарингоконъюнктивит, токсическая гепатопатия терапевт аденовирус, латиризм, нематодозы, бронхиальная астма сердечнососудистой системы гипертоническая болезнь</code> |
314
+ * Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
315
+ ```json
316
+ {
317
+ "scale": 20.0,
318
+ "similarity_fct": "cos_sim"
319
+ }
320
+ ```
321
+
322
+ ### Evaluation Dataset
323
+
324
+ #### Unnamed Dataset
325
+
326
+
327
+ * Size: 612 evaluation samples
328
+ * Columns: <code>anchor</code> and <code>positive</code>
329
+ * Approximate statistics based on the first 1000 samples:
330
+ | | anchor | positive |
331
+ |:--------|:------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
332
+ | type | string | string |
333
+ | details | <ul><li>min: 12 tokens</li><li>mean: 39.42 tokens</li><li>max: 128 tokens</li></ul> | <ul><li>min: 87 tokens</li><li>mean: 126.17 tokens</li><li>max: 128 tokens</li></ul> |
334
+ * Samples:
335
+ | anchor | positive |
336
+ |:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
337
+ | <code>У меня появились проблемы с кожей. К какому врачу я могу обратиться в районе Савеловской? <br><br><br></code> | <code>бережнова ольга сергеевна; стаж: 12 лет; пациенты: взрослые; тип приёма: в клинике; клиника: будь здоров на сущевском валу; савёловская, марьина роща, савеловская; специальность: дерматолог, венеролог, дерматовенеролог; специализация: релатокс, лечение гипергидроза аппаратная косметология, ксеомин, атравматическая химимические пилинги консультации по уходу за проблемной кожей лица мезотерапия, механическая, биоревитализация плазмолифтинг контурная пластика эстетическая коррекция мимических морщин лица препаратами ботокс, лантокс, диспорт, ультразвуковая</code> |
338
+ | <code>Мне поставили диагноз хронический гепатит. Какие препараты используются для лечения этого заболевания и есть ли возможность полностью вылечиться?</code> | <code>полунина татьяна евгеньевна; стоимость приема от: 35200 руб (высокая стоимость приема); стаж: 43 года; звание: профессор; учёная степень: доктор медицинских наук; специальность: гепатолог; пациенты: взрослые; тип приёма: в клинике; клиника: европейский медицинский центр в орловском пер. (емс); проспект мира, марьина роща; специализация: лечение заболеваний гастроинтестинального тракта</code> |
339
+ | <code>У меня сильная боль в пояснице, отдающая в ногу. Возможно ли это грыжа межпозвоночного диска? Какие обследования мне нужно пройти, чтобы точно поставить диагноз? И какие методы лечения вы применяете в таких случаях?</code> | <code>крайнов сергей анатольевич; стоимость приема от: 1733 руб (средняя стоимость приема); стаж: 44 года; квалификация: врач высшей категории; учёная степень: кандидат медицинских наук; пациенты: взрослые; тип приёма: в клинике; клиника: клиника неврологии и ортопедии здравклиник на октябрьской; октябрьская, добрынинская; специальность: ортопед, вертебролог, травматолог, артролог; специализация: вальгусная деформация, болезни костно мышечной системы и соединительной ткани, воспалительные спондилопатии, первичный гонартроз, грыжа позвоночника поясничного отдела, коленный артрит, грыжа шморля, грыжа беккера под коленом, артроз, анкилоз, бурсит, бурсит плеча, люмбаго с ишиасом, грыжа, артроз коленного сустава, артропатия, грыжа позвоночника, бурсит локтевого сустава, латеральный эпикондилит, стеноз позвоночного канала ещё ортопед адгезивный капсулит, спондилез поясничнокрестцового отдела позвоночника, контрактура, первичный генерализованный остеоартроз, вторичные коксартрозы, контрактура сустава, поражение костей и суставных хрящей, спондилолиз, сколиоз артрогрипоз спондилез грудного, декомпрессионная болезнь, гемартроз, коксартроз 2 степени, грыжа шейного отдела позвоночника, кифосколиоз, нестабильность коленного, коксартроз 3 степени, бурсит коленного сустава, спондилез грудного отдела позвоночника, киста тазобедренного сустава, грыжа ещё травматолог артроз неуточненный, миозит неуточненный, вторичный гонартроз, киста кости, межпозвоночная грыжа поясничнокрестцового отдела позвоночника, смещение позвонков, болезни костей, спондилез, бурсит большого вертела, бурситы бедра, поясничнокрестцового отдела позвоночника смещение позвонков косолапость косорукость кривошея растяжение связок стопы синовит тендинит плоскостопие кифосколиоз межпозвоночная грыжа поясничнокрестцового отдела позвоночника секвестрированная грыжа позвоночника поясничного отдела спинномозговая грыжа hallux valgus анкилоз арахнодактилия ахиллобурсит ахондроплазия болезнь горхема вальгусная деформация стопы у детей клинодактилия коксартроз суставов врожденная мышечная кривошея гемартроз гематогенный остеомиелит грыжи локтевой стилоидит дисплазия суставов контрактура контрактура дюпюитрена лордоз остеопороз пикнодизостоз мелореостоз молоткообразная деформация пальцев стопы мраморная болезнь нарушения осанки остеобластокластома остеомаляция плоскостопие вывихи полидактилия артрит склеродактилия хондродисплазия ахиллобурсит бурсит гемартроз растяжение специализируется на лечении артролог артрит, варусная деформация, поражения суставов вертебролог болезнь бехтерева, артроз неуточненный, обострение грыжи поясничного отдела, внутренние поражения колена, сколиоз, артроз первого запястно пястного сустава, мышечная деформация, наружное искривление большого пальца, заболевания суставов, грыжа шморля поясничного отдела позвоночника, бурсит локтевого отростка, гематома, грыжа между 4 и 5 позвонком, вторичный артроз суставов</code> |
340
+ * Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
341
+ ```json
342
+ {
343
+ "scale": 20.0,
344
+ "similarity_fct": "cos_sim"
345
+ }
346
+ ```
347
+
348
+ ### Training Hyperparameters
349
+ #### Non-Default Hyperparameters
350
+
351
+ - `num_train_epochs`: 10.0
352
+
353
+ #### All Hyperparameters
354
+ <details><summary>Click to expand</summary>
355
+
356
+ - `overwrite_output_dir`: False
357
+ - `do_predict`: False
358
+ - `eval_strategy`: no
359
+ - `prediction_loss_only`: True
360
+ - `per_device_train_batch_size`: 8
361
+ - `per_device_eval_batch_size`: 8
362
+ - `per_gpu_train_batch_size`: None
363
+ - `per_gpu_eval_batch_size`: None
364
+ - `gradient_accumulation_steps`: 1
365
+ - `eval_accumulation_steps`: None
366
+ - `learning_rate`: 5e-05
367
+ - `weight_decay`: 0.0
368
+ - `adam_beta1`: 0.9
369
+ - `adam_beta2`: 0.999
370
+ - `adam_epsilon`: 1e-08
371
+ - `max_grad_norm`: 1.0
372
+ - `num_train_epochs`: 10.0
373
+ - `max_steps`: -1
374
+ - `lr_scheduler_type`: linear
375
+ - `lr_scheduler_kwargs`: {}
376
+ - `warmup_ratio`: 0.0
377
+ - `warmup_steps`: 0
378
+ - `log_level`: passive
379
+ - `log_level_replica`: warning
380
+ - `log_on_each_node`: True
381
+ - `logging_nan_inf_filter`: True
382
+ - `save_safetensors`: True
383
+ - `save_on_each_node`: False
384
+ - `save_only_model`: False
385
+ - `restore_callback_states_from_checkpoint`: False
386
+ - `no_cuda`: False
387
+ - `use_cpu`: False
388
+ - `use_mps_device`: False
389
+ - `seed`: 42
390
+ - `data_seed`: None
391
+ - `jit_mode_eval`: False
392
+ - `use_ipex`: False
393
+ - `bf16`: False
394
+ - `fp16`: False
395
+ - `fp16_opt_level`: O1
396
+ - `half_precision_backend`: auto
397
+ - `bf16_full_eval`: False
398
+ - `fp16_full_eval`: False
399
+ - `tf32`: None
400
+ - `local_rank`: 0
401
+ - `ddp_backend`: None
402
+ - `tpu_num_cores`: None
403
+ - `tpu_metrics_debug`: False
404
+ - `debug`: []
405
+ - `dataloader_drop_last`: False
406
+ - `dataloader_num_workers`: 0
407
+ - `dataloader_prefetch_factor`: None
408
+ - `past_index`: -1
409
+ - `disable_tqdm`: False
410
+ - `remove_unused_columns`: True
411
+ - `label_names`: None
412
+ - `load_best_model_at_end`: False
413
+ - `ignore_data_skip`: False
414
+ - `fsdp`: []
415
+ - `fsdp_min_num_params`: 0
416
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
417
+ - `fsdp_transformer_layer_cls_to_wrap`: None
418
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
419
+ - `deepspeed`: None
420
+ - `label_smoothing_factor`: 0.0
421
+ - `optim`: adamw_torch
422
+ - `optim_args`: None
423
+ - `adafactor`: False
424
+ - `group_by_length`: False
425
+ - `length_column_name`: length
426
+ - `ddp_find_unused_parameters`: None
427
+ - `ddp_bucket_cap_mb`: None
428
+ - `ddp_broadcast_buffers`: False
429
+ - `dataloader_pin_memory`: True
430
+ - `dataloader_persistent_workers`: False
431
+ - `skip_memory_metrics`: True
432
+ - `use_legacy_prediction_loop`: False
433
+ - `push_to_hub`: False
434
+ - `resume_from_checkpoint`: None
435
+ - `hub_model_id`: None
436
+ - `hub_strategy`: every_save
437
+ - `hub_private_repo`: False
438
+ - `hub_always_push`: False
439
+ - `gradient_checkpointing`: False
440
+ - `gradient_checkpointing_kwargs`: None
441
+ - `include_inputs_for_metrics`: False
442
+ - `eval_do_concat_batches`: True
443
+ - `fp16_backend`: auto
444
+ - `push_to_hub_model_id`: None
445
+ - `push_to_hub_organization`: None
446
+ - `mp_parameters`:
447
+ - `auto_find_batch_size`: False
448
+ - `full_determinism`: False
449
+ - `torchdynamo`: None
450
+ - `ray_scope`: last
451
+ - `ddp_timeout`: 1800
452
+ - `torch_compile`: False
453
+ - `torch_compile_backend`: None
454
+ - `torch_compile_mode`: None
455
+ - `dispatch_batches`: None
456
+ - `split_batches`: None
457
+ - `include_tokens_per_second`: False
458
+ - `include_num_input_tokens_seen`: False
459
+ - `neftune_noise_alpha`: None
460
+ - `optim_target_modules`: None
461
+ - `batch_eval_metrics`: False
462
+ - `eval_on_start`: False
463
+ - `batch_sampler`: batch_sampler
464
+ - `multi_dataset_batch_sampler`: proportional
465
+
466
+ </details>
467
+
468
+ ### Training Logs
469
+ | Epoch | Step | Training Loss |
470
+ |:------:|:----:|:-------------:|
471
+ | 1.6340 | 500 | 0.8112 |
472
+ | 3.2680 | 1000 | 0.4466 |
473
+ | 4.9020 | 1500 | 0.3019 |
474
+ | 6.5359 | 2000 | 0.1975 |
475
+ | 8.1699 | 2500 | 0.1457 |
476
+ | 9.8039 | 3000 | 0.094 |
477
+ | 1.6340 | 500 | 0.1258 |
478
+ | 3.2680 | 1000 | 0.0681 |
479
+ | 4.9020 | 1500 | 0.0522 |
480
+ | 6.5359 | 2000 | 0.0331 |
481
+ | 8.1699 | 2500 | 0.0303 |
482
+ | 9.8039 | 3000 | 0.0296 |
483
+ | 1.6340 | 500 | 0.034 |
484
+ | 3.2680 | 1000 | 0.0197 |
485
+ | 4.9020 | 1500 | 0.0202 |
486
+ | 6.5359 | 2000 | 0.01 |
487
+ | 8.1699 | 2500 | 0.0085 |
488
+ | 9.8039 | 3000 | 0.0147 |
489
+
490
+
491
+ ### Framework Versions
492
+ - Python: 3.10.12
493
+ - Sentence Transformers: 3.0.1
494
+ - Transformers: 4.42.4
495
+ - PyTorch: 2.4.0+cu121
496
+ - Accelerate: 0.32.1
497
+ - Datasets: 2.21.0
498
+ - Tokenizers: 0.19.1
499
+
500
+ ## Citation
501
+
502
+ ### BibTeX
503
+
504
+ #### Sentence Transformers
505
+ ```bibtex
506
+ @inproceedings{reimers-2019-sentence-bert,
507
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
508
+ author = "Reimers, Nils and Gurevych, Iryna",
509
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
510
+ month = "11",
511
+ year = "2019",
512
+ publisher = "Association for Computational Linguistics",
513
+ url = "https://arxiv.org/abs/1908.10084",
514
+ }
515
+ ```
516
+
517
+ #### MultipleNegativesRankingLoss
518
+ ```bibtex
519
+ @misc{henderson2017efficient,
520
+ title={Efficient Natural Language Response Suggestion for Smart Reply},
521
+ author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
522
+ year={2017},
523
+ eprint={1705.00652},
524
+ archivePrefix={arXiv},
525
+ primaryClass={cs.CL}
526
+ }
527
+ ```
528
+
529
+ <!--
530
+ ## Glossary
531
+
532
+ *Clearly define terms in order to be accessible across audiences.*
533
+ -->
534
+
535
+ <!--
536
+ ## Model Card Authors
537
+
538
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
539
+ -->
540
+
541
+ <!--
542
+ ## Model Card Contact
543
+
544
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
545
+ -->
config.json ADDED
@@ -0,0 +1,26 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "_name_or_path": "sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2",
3
+ "architectures": [
4
+ "BertModel"
5
+ ],
6
+ "attention_probs_dropout_prob": 0.1,
7
+ "classifier_dropout": null,
8
+ "gradient_checkpointing": false,
9
+ "hidden_act": "gelu",
10
+ "hidden_dropout_prob": 0.1,
11
+ "hidden_size": 384,
12
+ "initializer_range": 0.02,
13
+ "intermediate_size": 1536,
14
+ "layer_norm_eps": 1e-12,
15
+ "max_position_embeddings": 512,
16
+ "model_type": "bert",
17
+ "num_attention_heads": 12,
18
+ "num_hidden_layers": 12,
19
+ "pad_token_id": 0,
20
+ "position_embedding_type": "absolute",
21
+ "torch_dtype": "float32",
22
+ "transformers_version": "4.42.4",
23
+ "type_vocab_size": 2,
24
+ "use_cache": true,
25
+ "vocab_size": 250037
26
+ }
config_sentence_transformers.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "__version__": {
3
+ "sentence_transformers": "3.0.1",
4
+ "transformers": "4.42.4",
5
+ "pytorch": "2.4.0+cu121"
6
+ },
7
+ "prompts": {},
8
+ "default_prompt_name": null,
9
+ "similarity_fn_name": null
10
+ }
model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:4b124394665afd594fcf6ee543dbac618fc248eae4b549ee487f8fd2c849bf75
3
+ size 470637416
modules.json ADDED
@@ -0,0 +1,14 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "",
6
+ "type": "sentence_transformers.models.Transformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_Pooling",
12
+ "type": "sentence_transformers.models.Pooling"
13
+ }
14
+ ]
sentence_bert_config.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "max_seq_length": 128,
3
+ "do_lower_case": false
4
+ }
special_tokens_map.json ADDED
@@ -0,0 +1,51 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "bos_token": {
3
+ "content": "<s>",
4
+ "lstrip": false,
5
+ "normalized": false,
6
+ "rstrip": false,
7
+ "single_word": false
8
+ },
9
+ "cls_token": {
10
+ "content": "<s>",
11
+ "lstrip": false,
12
+ "normalized": false,
13
+ "rstrip": false,
14
+ "single_word": false
15
+ },
16
+ "eos_token": {
17
+ "content": "</s>",
18
+ "lstrip": false,
19
+ "normalized": false,
20
+ "rstrip": false,
21
+ "single_word": false
22
+ },
23
+ "mask_token": {
24
+ "content": "<mask>",
25
+ "lstrip": true,
26
+ "normalized": false,
27
+ "rstrip": false,
28
+ "single_word": false
29
+ },
30
+ "pad_token": {
31
+ "content": "<pad>",
32
+ "lstrip": false,
33
+ "normalized": false,
34
+ "rstrip": false,
35
+ "single_word": false
36
+ },
37
+ "sep_token": {
38
+ "content": "</s>",
39
+ "lstrip": false,
40
+ "normalized": false,
41
+ "rstrip": false,
42
+ "single_word": false
43
+ },
44
+ "unk_token": {
45
+ "content": "<unk>",
46
+ "lstrip": false,
47
+ "normalized": false,
48
+ "rstrip": false,
49
+ "single_word": false
50
+ }
51
+ }
tokenizer.json ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:cad551d5600a84242d0973327029452a1e3672ba6313c2a3c3d69c4310e12719
3
+ size 17082987
tokenizer_config.json ADDED
@@ -0,0 +1,64 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "added_tokens_decoder": {
3
+ "0": {
4
+ "content": "<s>",
5
+ "lstrip": false,
6
+ "normalized": false,
7
+ "rstrip": false,
8
+ "single_word": false,
9
+ "special": true
10
+ },
11
+ "1": {
12
+ "content": "<pad>",
13
+ "lstrip": false,
14
+ "normalized": false,
15
+ "rstrip": false,
16
+ "single_word": false,
17
+ "special": true
18
+ },
19
+ "2": {
20
+ "content": "</s>",
21
+ "lstrip": false,
22
+ "normalized": false,
23
+ "rstrip": false,
24
+ "single_word": false,
25
+ "special": true
26
+ },
27
+ "3": {
28
+ "content": "<unk>",
29
+ "lstrip": false,
30
+ "normalized": false,
31
+ "rstrip": false,
32
+ "single_word": false,
33
+ "special": true
34
+ },
35
+ "250001": {
36
+ "content": "<mask>",
37
+ "lstrip": true,
38
+ "normalized": false,
39
+ "rstrip": false,
40
+ "single_word": false,
41
+ "special": true
42
+ }
43
+ },
44
+ "bos_token": "<s>",
45
+ "clean_up_tokenization_spaces": true,
46
+ "cls_token": "<s>",
47
+ "do_lower_case": true,
48
+ "eos_token": "</s>",
49
+ "mask_token": "<mask>",
50
+ "max_length": 128,
51
+ "model_max_length": 128,
52
+ "pad_to_multiple_of": null,
53
+ "pad_token": "<pad>",
54
+ "pad_token_type_id": 0,
55
+ "padding_side": "right",
56
+ "sep_token": "</s>",
57
+ "stride": 0,
58
+ "strip_accents": null,
59
+ "tokenize_chinese_chars": true,
60
+ "tokenizer_class": "BertTokenizer",
61
+ "truncation_side": "right",
62
+ "truncation_strategy": "longest_first",
63
+ "unk_token": "<unk>"
64
+ }
unigram.json ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:da145b5e7700ae40f16691ec32a0b1fdc1ee3298db22a31ea55f57a966c4a65d
3
+ size 14763260