strongpear commited on
Commit
5c7dfdf
1 Parent(s): af478d9

Add new SentenceTransformer model

Browse files
.gitattributes CHANGED
@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
 
 
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
36
+ tokenizer.json filter=lfs diff=lfs merge=lfs -text
1_Pooling/config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "word_embedding_dimension": 1024,
3
+ "pooling_mode_cls_token": true,
4
+ "pooling_mode_mean_tokens": false,
5
+ "pooling_mode_max_tokens": false,
6
+ "pooling_mode_mean_sqrt_len_tokens": false,
7
+ "pooling_mode_weightedmean_tokens": false,
8
+ "pooling_mode_lasttoken": false,
9
+ "include_prompt": true
10
+ }
README.md ADDED
@@ -0,0 +1,749 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ base_model: BAAI/bge-m3
3
+ library_name: sentence-transformers
4
+ pipeline_tag: sentence-similarity
5
+ tags:
6
+ - sentence-transformers
7
+ - sentence-similarity
8
+ - feature-extraction
9
+ - generated_from_trainer
10
+ - dataset_size:123750
11
+ - loss:MultipleNegativesRankingLoss
12
+ widget:
13
+ - source_sentence: Kết quả nghiên cứu cho thấy điều gì về sự chuyên môn hóa chức năng
14
+ ở bán cầu não của trẻ em suy giảm khả năng học tập và ngôn ngữ?
15
+ sentences:
16
+ - Cấu trúc não trên hình ảnh cộng hưởng từ ở trẻ suy giảm khả năng học tập và ngôn
17
+ ngữ. Sử dụng hình ảnh cộng hưởng từ, 20 trẻ em bị suy giảm khả năng học tập và
18
+ ngôn ngữ được so sánh với 12 đối tượng đối chứng bình thường. Cấu trúc tổng thể
19
+ của não đặc biệt bình thường ở nhóm suy giảm khả năng học tập và ngôn ngữ. Hình
20
+ thái bán tự động được sử dụng để đo thể tích bán cầu và sự bất đối xứng của não
21
+ ở sáu vùng não. Thể tích của vùng perisylvian phía sau bên trái giảm đáng kể ở
22
+ trẻ suy giảm khả năng học tập và ngôn ngữ. Sự bất đối xứng ở vùng não dưới trước
23
+ và trên sau cũng khác biệt đáng kể ở nhóm này. Kết quả so sánh nhóm mô tả về thể
24
+ tích ước tính của các cấu trúc chất xám khác của não làm tăng khả năng một số
25
+ trẻ bị suy giảm khả năng ngôn ngữ và khả năng học tập có thể bị giảm thêm thể
26
+ tích ở các cấu trúc vỏ não và dưới vỏ não. Kết quả cho thấy sự chuyên môn hóa
27
+ chức năng ở bán cầu có thể là bất thường ở nhóm dân số này.
28
+ - để đánh giá sự xâm nhập đường thở của bạch cầu ái toan trong phản ứng hen suyễn
29
+ của chuột cống nâu Na Uy được mẫn cảm với ovalbumin, diễn biến thời gian của sự
30
+ xâm nhập bạch cầu ái toan và sức đề kháng hô hấp rrs sau khi thử thách ovalbumin
31
+ được đo lường, hiệu quả của việc điều trị bằng kháng thể đơn dòng chống lại icam
32
+ và cd cuối cùng đã được nghiên cứu biểu hiện icam và cd trong đường thở đã được
33
+ nghiên cứu tất cả chuột đều cho thấy tỷ lệ rrs tăng nhiều giờ sau khi thử thách
34
+ với albumin ovalbumin cho thấy phản ứng hen muộn. Những con vật mắc bệnh lar có
35
+ số lượng bạch cầu ái toan cao hơn những con có IAR iar và ở những con vật nhạy
36
+ cảm nhưng không bị thách thức, chuột được điều trị bằng kháng thể cho thấy mức
37
+ tăng rrs nhỏ hơn đáng kể và số lượng bạch cầu ái toan thấp hơn so với hóa mô miễn
38
+ dịch ở động vật đối chứng IF trong đường thở được thực hiện. Phản ứng miễn dịch
39
+ icam dương tính trên cả biểu mô và nội mô mạch máu của phần tr và trên biểu hiện
40
+ icam nội mô mạch máu phổi được điều chỉnh tăng thách thức T3. Các tế bào dương
41
+ tính cd trong các phần của tr và phổi tăng lên sau thử thách, kết quả của chúng
42
+ tôi cho thấy sự thâm nhập của bạch cầu ái toan rất quan trọng trong sự phát triển
43
+ của ấu trùng và việc điều trị bằng chất đối kháng của icam và cd có thể mang lại
44
+ một phương pháp điều trị để giảm các triệu chứng hen suyễn
45
+ - pH của chất trào ngược vào thực quản là một yếu tố quan trọng không chỉ đối với
46
+ RE mà còn đối với barretts thực quản và OD của CA thực quản barretts. Mặt khác,
47
+ nhiễm vi khuẩn H pylori được cho là ngăn ngừa viêm thực quản trào ngược và barretts
48
+ thực quản bằng cách gây ra viêm teo dạ dày. lần lượt giảm GAS hơn nữa việc bảo
49
+ tồn GAS có thể quan trọng đối với sự phát triển của CA nối dạ dày thực quản bao
50
+ gồm cả barretts EC bất kể tình trạng nhiễm H pylori. Sự gia tăng tiết axit dạ
51
+ dày ở dân số Nhật Bản đã được dự đoán dựa trên tỷ lệ nhiễm H pylori giảm và Việc
52
+ phương Tây hóa thói quen ăn uống ở Nhật Bản điều này có thể dẫn đến sự gia tăng
53
+ tỷ lệ mắc bệnh ung thư thực quản Barretts ở Nhật Bản trong tương lai
54
+ - source_sentence: Tại sao việc điều trị viêm tiểu phế quản sai cách lại nguy hiểm
55
+ cho trẻ?
56
+ sentences:
57
+ - 'Mẫu máu để xét nghiệm lipid máu thường được lấy ở tĩnh mạch hoặc mao mạch trong
58
+ điều kiện đói, nghĩa là bệnh nhân cần được nhịn ăn khoảng 9-12 giờ trước khi lấy
59
+ máu.
60
+
61
+ 1.
62
+
63
+ Sinh học của lipid và lipoprotein
64
+
65
+ Lipid là một nhóm chất béo và các chất giống như chất béo, là thành phần quan
66
+ trọng của tế bào và nguồn năng lượng. Hai lipid quan trọng là cholesterol và triglyceride,
67
+ được vận chuyển trong máu bởi các hạt lipoprotein. Các hạt lipid được cấu tạo
68
+ bới các phân tử protein, cholesterol, triglyceride và phospholipid và được phân
69
+ loại theo tỷ trọng thành các lipoprotein tỷ trọng cao (HDL), lipoprotein tỷ trọng
70
+ thấp (LDL) và lipoprotein tỷ trọng rất thấp (VLDL).
71
+
72
+ Cholesterol có thể được tổng hợp trong cơ thể từ các mẩu 2C (nội sinh) hoặc được
73
+ đưa từ ngoài và qua đường ăn uống. Việc ăn quá nhiều thực phẩm chứa nhiều chất
74
+ béo hoặc yếu tố di truyền có thể làm tăng mức độ cholesterol trong máu.
75
+
76
+
77
+ Lượng cholesterol dư thừa có thể được lắng đọng trong các mảng bám trên thành
78
+ mạch máu, có thể gây hẹp lòng mạch, ngăn cản sự lưu thông của máu, dẫn đến xơ
79
+ cứng động mạch (xơ vữa động mạch) và làm tăng nguy cơ mắc nhiều bệnh, gồm bệnh
80
+ tim mạch và đột quỵ. Một mức độ triglyceride cao trong máu cũng có thể làm tăng
81
+ nguy cơ phát triển bệnh tim mạch (CVD).
82
+
83
+ 2.
84
+
85
+ Sử dụng
86
+
87
+ Các xét nghiệm lipid, lipoprotein được sử dụng để phát hiện, chẩn đoán, theo dõi
88
+ điều trị và tiên lượng các rối loạn chuyển hóa lipid trong nhiều bệnh, chẳng hạn
89
+ như bệnh tim mạch (CHD), đái tháo đường (DM), hội chứng chuyển hóa (MS), bệnh
90
+ thận mạn (CKD), ...
91
+
92
+ Các thông số lipid, lipoprotein và tỷ số của chúng được sử dụng trong lâm sàng
93
+ gồm: 1) Triglycerides (TG); 2) Cholesterol toàn phần (total cholesterol: TC);
94
+ 3) Cholesterol lipoprotein tỷ trọng cao (HDL-C); 4) Cholesterol lipoprotein tỷ
95
+ trọng thấp (LDL-C); 5) Non-HDL-C; 6) Tỷ số TG/HDL-C; 7) Tỷ số TC/HDL-C; 8) Tỷ
96
+ số LDL/HDL-C; 9) Tỷ số non-HDL/HDL-C.
97
+
98
+ 3.
99
+
100
+ Chỉ định xét nghiệm lipid máu
101
+
102
+
103
+ Người trưởng thành khỏe mạnh không có các yếu tố nguy cơ mắc bệnh tim khác nên
104
+ được chỉ định các xét nghiệm lipid lúc đói mỗi 4 đến 6 năm một lần. Nếu kết quả
105
+ kiểm tra lipid máu bất thường, cần được quản lý, xét nghiệm thường xuyên hơn với
106
+ bệnh án đầy đủ.'
107
+ - Việc sử dụng ống dẫn thần kinh nhân tạo chứa các tế bào schwann khả thi là một
108
+ trong những chiến lược hứa hẹn nhất để sửa chữa tổn thương PN nhằm chế tạo một
109
+ ống dẫn thần kinh hiệu quả có cấu trúc vi mô và môi trường bên trong thuận lợi
110
+ hơn trong việc tái tạo thần kinh so với các kỹ thuật hiện có bằng kỹ thuật d schwann
111
+ CC ba chiều mới. MG và DRG drg được phát triển ống dẫn thần kinh của các tế bào
112
+ schwann được sắp xếp d được chế tạo bằng cách gieo trực tiếp drg mới thu hoạch
113
+ vào các ống silicon chứa đầy matrigel có đường kính trong mm mm và nuôi cấy trong
114
+ ống nghiệm SC trong nhiều tuần quá trình tái tạo dây thần kinh của ống dẫn tế
115
+ bào schwann nuôi cấy d nhóm n được đánh giá bằng cách sử dụng khuyết tật dây thần
116
+ kinh tọa của chuột spraguedawley mm và được so sánh với khuyết tật của ống dẫn
117
+ silicone chứa đầy matrigel và SC được điều chế bằng phương pháp SC đơn giản thông
118
+ thường nhóm d ống dẫn hai chiều n sau nhiều tuần chức năng thần kinh tọa được
119
+ đánh giá bằng phân tích dáng đi và SFI sfi và hình thái học của ống dẫn thần kinh
120
+ và các mô bẩm sinh của dây thần kinh tọa đã được kiểm tra bằng cách sử dụng máy
121
+ phân tích hình ảnh và phương pháp điện hiển vi góc nghiêng của sfi và mắt cá chân
122
+ trong PET DUE là độ độ trong nhóm ống dẫn d n và độ trong nhóm ống dẫn d n nhóm
123
+ có bao myelin sợi trục nằm trong nhóm ống dẫn d và trong nhóm ống dẫn d trong
124
+ electron truyền TSM T0, nhóm ống dẫn d cho thấy SF thần kinh có myelin phong phú
125
+ hơn với collagen ngoại bào dày và được tổ chức tốt hơn so với nhóm ống dẫn d và
126
+ gân GM và BF trong ống dẫn d nhóm ít bị teo hơn và giảm tình trạng xơ hóa với
127
+ ít thâm nhiễm mỡ hơn so với nhóm ống dẫn d. Một kỹ thuật nuôi cấy tế bào d schwann
128
+ mới đã được thiết lập và ống dẫn thần kinh được chế tạo bằng kỹ thuật này cho
129
+ thấy khả năng tái tạo thần kinh được cải thiện nhiều so với ống silicone chứa
130
+ đầy matrigel và SC được điều chế từ phương pháp nuôi cấy đơn giản thông thường
131
+ - "– Cho trẻ viêm tiểu phế quản tái khám theo đúng lịch hẹn của bác sĩ đã dặn.\n\
132
+ \ So với các bệnh về hô hấp thông thường, bệnh viêm tiểu phế quản ở trẻ em có\
133
+ \ triệu chứng đặc thù là biểu hiện khò khè, khó thở. Nếu điều trị sai cách khiến\
134
+ \ triệu chứng trở nặng, trẻ có nguy cơ bị suy hô hấp và kéo theo các biến chứng\
135
+ \ nguy hiểm khác như: tràn khí màng phổi, viêm phổi, xẹp phổi, hen phế quản… Do\
136
+ \ đó, phụ huynh chớ chủ quan mà nên cho bé đi khám kịp thời để được bác sĩ tư\
137
+ \ vấn phác đồ điều trị phù hợp, đảm bảo hiệu quả và an toàn nhé."
138
+ - source_sentence: Nguy cơ bị ung thư phổi có liên quan như thế nào đến việc hút thuốc
139
+ lá điện tử?
140
+ sentences:
141
+ - "– Kết hợp những loại đồ ăn chung không phù hợp ví dụ như ăn đồ quá nóng cùng\
142
+ \ lúc với đồ quá lạnh hoặc ăn đồ sống lẫn với đồ chín,…\n – Uống nhiều rượu bia.\n\
143
+ \ – Những thói quen ăn uống không tốt như bỏ bữa, ăn quá nhanh, ăn uống tùy ý\
144
+ \ không đúng giờ, ăn đêm, ăn quá no hoặc để bụng quá đói trong 1 bữa,…\n Ăn uống\
145
+ \ không khoa học là nguyên nhân phổ biến gây ra cơn đau dạ dày về đêm.\n 2.2.\
146
+ \ Do căng thẳng\n Hiện tượng đau dạ dày về ban đêm cũng có thể xảy ra nếu bạn\
147
+ \ thường xuyên rơi vào trạng thái căng thẳng, mệt mỏi trong thời gian dài. Khi\
148
+ \ căng thẳng, dạ dày phải hoạt động nhiều hơn bình thường và tiết ra nhiều acid\
149
+ \ hơn. Điều này dễ khiến niêm mạc của dạ dày chịu nhiều tổn thương. Đây cũng là\
150
+ \ lý do vì sao khi stress bạn thường gặp phải các vấn đề tiêu hóa như chán ăn,\
151
+ \ ăn không ngon và trong đó có những cơn đau bụng âm ỉ về buổi đêm.\n 2.3. Nguyên\
152
+ \ nhân bệnh lý ở dạ dày\n Đây là nguyên nhân trực tiếp dẫn đến những cơn đau bụng\
153
+ \ về đêm. Các bệnh dạ dày thường gặp dẫn đến cơn đau về đêm bao gồm:\n – Viêm\
154
+ \ dạ dày\n – Loét dạ dày\n – Trào ngược dạ dày thực quản\n – Viêm hành tá tràng\n\
155
+ \ – Hội chứng ruột kích thích (IBS)\n – Bệnh Crohn\n – Thậm chí là ung thư\n 2.4.\
156
+ \ Đau dạ dày đêm đến từ bệnh lý khác ngoài đường tiêu hóa\n Một số bệnh lý ngoài\
157
+ \ đường tiêu hóa sau đây có thể là nguyên nhân gây đau dạ dày lúc về đêm:\n –\
158
+ \ Sỏi mật: Đây cũng là nguyên nhân thường gặp khi bệnh nhân thăm khám với triệu\
159
+ \ chứng đau dạ dày ban đêm. Sỏi mật bị tắt tại ống mật gây ra những cơn đau quặn\
160
+ \ dữ dội liên tục ở phía dạ dày. Cơn đau có xu hướng gia tăng sau một bữa ăn với\
161
+ \ nhiều chất béo và “hoành hành” khi bạn đã chìm vào giấc ngủ. Cơn đau có thể\
162
+ \ kèm theo cảm giác buồn nôn, nôn, sốt cao, người bệnh bị vàng da vàng mắt và\
163
+ \ phân có màu trắng.\n – Sỏi thận: Khi viên sỏi di chuyển và đi vào niệu quản\
164
+ \ thì bệnh nhân sẽ gặp phải cơn đau nhói đột ngột ở vùng lưng. Sau đó, cơn đau\
165
+ \ nhanh chóng lan đến dạ dày và cả vùng bụng."
166
+ - Nghiên cứu hiện tại đã so sánh hai hệ thống phân loại khác nhau của bệnh nhân
167
+ mắc cvid suy giảm miễn dịch VL thông thường, một dựa trên sinh tổng hợp globulin
168
+ miễn dịch trong ống nghiệm và một hệ thống khác dựa trên số lượng tế bào cdnaïve.
169
+ Các tế bào đơn nhân máu ngoại vi (pbmcs) được phân lập từ các bệnh nhân cvid và
170
+ đối chứng khỏe mạnh mà chúng được kích thích cho Sự tiết ra igm và igg T3 kích
171
+ thích bằng túi SAC i khi bổ sung interleukin il hoặc với các tập hợp tế bào T
172
+ mitogen t pokeweed được ước tính bằng phương pháp đo tế bào dòng chảy bởi hệ thống
173
+ đầu tiên. igm nhưng o sự trao đổi gen nhẹ giữa các quần thể trên cơ sở T0 của
174
+ cấu trúc di truyền quần thể và quần thể gongliu có độ đa dạng di truyền cao nhất
175
+ cần được ưu tiên cao trong việc bảo tồn nguồn gen malus stirersii trong bảo tồn
176
+ nguồn gen tại chỗ
177
+ - "Nguy cơ bị ung thư phổi liên quan đến hệ thống phân phối điện tử (ví dụ: thuốc\
178
+ \ lá điện tử) vẫn còn được xác định, mặc dù người ta cho rằng các sản phẩm của\
179
+ \ quá trình đốt cháy thuốc lá là các chất gây ung thư chính.\nNguy cơ bị ung thư\
180
+ \ sẽ giảm sau khi ngừng hút thuốc, nhưng không bao giờ trở về mức nguy cơ ở lần\
181
+ \ khám ban đầu ở những người không bao giờ hút thuốc. Có khoảng 15 đến 20% những\
182
+ \ người bị ung thư phổi chưa bao giờ hút thuốc hoặc hút thuốc rất ít.\nLiệu có\
183
+ \ hay không và lượng phơi nhiễm với radon trong các hộ gia đình là bao nhiêu để\
184
+ \ dẫn đến tăng nguy cơ bị ung thư phổi thì vẫn còn nhiều tranh cãi.\nViêm mạn\
185
+ \ tính làm tăng nguy cơ mắc nhiều bệnh ung thư, bao gồm cả ung thư phổi. Ví dụ:\
186
+ \ COPD (bệnh phổi tắc nghẽn mạn tính), thiếu hụt alpha-1 antitrypsin và xơ phổi\
187
+ \ làm tăng độ nhạy cảm với ung thư phổi. Ở những bệnh nhân có sẹo ở phổi do các\
188
+ \ bệnh phổi khác (ví dụ: bệnh lao) có khả năng tăng nguy cơ bị ung thư phổi. Ngoài\
189
+ \ ra, những người hút thuốc có hoạt tính sử dụng chất bổ sung beta-carotene có\
190
+ \ thể có nguy cơ phát triển ung thư phổi. \n \nĐánh giá rủi ro ung thư phổi ở\
191
+ \ những người đang hút thuốc hiện tại và quá khứ (6 tuổi)\nCác tế bào biểu mô\
192
+ \ hô hấp đòi hỏi phải tiếp xúc kéo dài với tác nhân gây ung thư và tích tụ nhiều\
193
+ \ đột biến di truyền trước khi trở thành ung thư phổi (một hiệu ứng gọi là ung\
194
+ \ thư trường diễn). \nỞ một số bệnh nhân bị ung thư phổi, các đột biến thứ phát\
195
+ \ hoặc bổ sung ở các gen kích thích sự phát triển của tế bào (K-ras, MYC) gây\
196
+ \ ra những bất thường trong receptor nhận tín hiệu của yếu tố tăng trưởng (EGFR,\
197
+ \ HER2/neu) và ức chế quá trình chết của tế bào, góp phần làm tăng sự phát triển\
198
+ \ không kiểm soát các tế bào bất thường. Ngoài ra, các đột biến ức chế gen ức\
199
+ \ chế khối u (ví dụ: p53, APC) có thể dẫn đến ung thư. Các đột biến khác có thể\
200
+ \ là nguyên nhân bao gồm chuyển vị EML-4-ALK và các đột biến ở ROS-1, BRAF và\
201
+ \ PI3KCA. Các gen là nguyên nhân gây ung thư phổi được gọi là đột biến thúc đẩy\
202
+ \ gen sinh ung thư."
203
+ - source_sentence: Tại sao người bệnh nên thăm khám sớm khi có triệu chứng thoái hóa
204
+ cột sống?
205
+ sentences:
206
+ - "Thời điểm tiêm vắc xin phế cầu cho trẻ thường bắt đầu khi trẻ đủ từ 6 tuần tuổi\
207
+ \ trở lên. Trẻ sẽ được tiêm ở khu vực cơ delta của cánh tay hoặc mặt trước của\
208
+ \ đùi. Sau đây là những thời điểm cụ thể mà các cha mẹ cần nắm rõ để lưu ý đưa\
209
+ \ trẻ đi tiêm phòng phế cầu đúng lịch:\n 2.1. Tiêm phế cầu cho bé từ 6 tuần đến\
210
+ \ 6 tháng tuổi\n Trẻ sơ sinh từ 6 tuần đến 6 tháng tuổi được khuyến cáo áp dụng\
211
+ \ 1 trong 2 liệu trình tiêm vắc xin như sau:\n Tiêm 3 liều cơ bản: Mũi tiêm đầu\
212
+ \ tiên sẽ được thực hiện khi trẻ tròn mốc 2 tháng tuổi. Mũi thứ 2 sẽ cách mũi\
213
+ \ đầu 1 tháng và mũi cuối cùng cách mũi thứ 2 sau 1 tháng. Trẻ sẽ tiêm mũi nhắc\
214
+ \ lại sau 6 tháng kể từ ngày hoàn thành mũi thứ 3.\n Tiêm 2 liều cơ bản: Mũi tiêm\
215
+ \ đầu tiên được áp dụng khi trẻ đủ 2 tháng tuổi. Mũi tiêm tiếp theo cách mũi đầu\
216
+ \ sau 2 tháng.\n Liều tiêm nhắc lại sau ít nhất 6 tháng kể từ ngày tiêm mũi cơ\
217
+ \ bản cuối cùng.\n 2.2. Tiêm vắc xin phế cầu cho trẻ sinh non\n Đối với các bé\
218
+ \ sinh non khi tiêm vắc xin phế cầu cần phải tuân theo chỉ định của bác sĩ chuyên\
219
+ \ khoa. Thay vì áp dụng lịch tiêm cơ bản như trên, các bé sinh non cần được tiêm\
220
+ \ đủ 4 liều vắc xin phế cầu, mỗi liều 0,5ml.\n Theo đó, 3 mũi tiêm đầu tiên cũng\
221
+ \ sẽ được chỉ định tiêm khi trẻ đủ 2 tháng tuổi. Các mũi 2 và mũi 3 cách nhau\
222
+ \ 1 tháng. Riêng mũi 4 áp dụng tiêm sau 6 tháng tiếp theo.\n 2.3. Tiêm vắc xin\
223
+ \ cho bé từ 7 – 11 tháng, chưa từng tiêm vắc xin phòng phế cầu khuẩn\n Trẻ nhỏ\
224
+ \ từ 7 đến 11 tháng tuổi sẽ tiêm theo liệu trình 2 mũi cơ bản, khoảng cách giữa\
225
+ \ các mũi tiêm là 1 tháng. Mũi nhắc lại sẽ tiêm khi trẻ trên 1 tuổi hoặc có thể\
226
+ \ tiêm cách mũi thứ 2 khoảng 2 tháng.\n 2.4. Tiêm vắc xin cho bé đủ 12 đến 23\
227
+ \ tháng tuổi\n Liều tiêm cho bé từ 12 tháng đến dưới 2 tuổi là 2 liều, mỗi liều\
228
+ \ tiêm 0,5ml. Khoảng cách giữa 2 liều tiêm tối thiểu 2 tháng."
229
+ - "Triệu chứng thoái hóa cột sống theo từng vị tríTriệu chứng thoái hóa cột sống\
230
+ \ thường gặp là đau nhức xương khớp. Tùy thuộc vào các vị trí nhất định, người\
231
+ \ bệnh sẽ có biểu hiện và cảm nhận không giống nhau. Khi xuất hiện các triệu chứng\
232
+ \ nghi ngờ thoái hóa, người bệnh nên chủ động thăm khám sớm để được điều trị kịp\
233
+ \ thời.\n Triệu chứng thoái hóa cột sống thường gặp là đau nhức xương khớp. Tùy\
234
+ \ thuộc vào các vị trí nhất định, người bệnh sẽ có biểu hiện và cảm nhận không\
235
+ \ giống nhau. Khi xuất hiện các triệu chứng nghi ngờ thoái hóa, người bệnh nên\
236
+ \ chủ động thăm khám sớm để được điều trị kịp thời.\n 1. Thoái hóa cột sống là\
237
+ \ gì?\n Thoái hóa đốt sống là tình trạng lớp sụn khớp bị hao mòn dần dần, trong\
238
+ \ quá trình hoạt động thể chất, các đầu đốt sống sẽ cọ xát trực tiếp vào nhau\
239
+ \ gây viêm nhiễm, dẫn đến màng hoạt dịch sưng tấy và dịch khớp bị khô do dịch\
240
+ \ khớp bị hạn chế. bài tiết. Ngoài ra, ma sát ở các đầu xương cũng góp phần hình\
241
+ \ thành các gai xương tại đây. Các gai xương phát triển quá mức cọ sát vào đốt\
242
+ \ sống, rễ thần kinh và các mô mềm xung quanh.\n Thoái hóa đốt sống là tình trạng\
243
+ \ lớp sụn khớp bị hao mòn dần dần, cọ xát vào nhau gây viêm nhiễm.\n 2. Triệu\
244
+ \ chứng thoái hóa cột sống theo vị trí khởi phát\n Hầu hết bệnh nhân đều cảm thấy\
245
+ \ đau và khó chịu. Cơn đau ở mỗi trường hợp sẽ khác nhau tùy theo vị trí đốt sống\
246
+ \ bị thoái hóa, cụ thể như:\n 2.1. Triệu chứng thoái hóa cột sống thắt lưng cần\
247
+ \ lưu ý\n Triệu chứng của bệnh ở giai đoạn này không rõ ràng, thường chỉ đau nhẹ\
248
+ \ hoặc không đau, chỉ có cảm giác đau nhẹ ở lưng, do sụn khớp mới bắt đầu có dấu\
249
+ \ hiệu bào mòn nên rất dễ nhầm lẫn với bệnh đau lưng đơn thuần. nỗi đau. Vì vậy,\
250
+ \ có xu hướng chủ quan hướng tới các giai đoạn bệnh nặng hơn.\n Tiếp theo là cơn\
251
+ \ đau xuất hiện dưới dạng đau âm ỉ, đau khi làm việc và biến mất khi nghỉ ngơi,\
252
+ \ đặc biệt là khi nằm trên sàn cứng (nệm cứng). Đồng thời có dấu hiệu giảm khả\
253
+ \ năng vận động, thường xuyên bị đau nhức, khó chịu khi mang vác vật nặng."
254
+ - "– Chảy máu âm đạo bất thường\n Tình trạng thai ở ngoài tử cung có thể chẩn đoán\
255
+ \ thông qua siêu âm\n Tình trạng mang thai ngoài tử cung nếu có các dấu hiệu nghi\
256
+ \ ngờ bản thân mang thai ở ngoài tử cung, chị em cần đến các cơ sở y tế chuyên\
257
+ \ khoa để được các bác sĩ chẩn đoán và đưa ra các chỉ định kịp thời.\n Chẩn đoán\
258
+ \ thai ngoài tử cung thường sử dụng các phương pháp sau:\n – Thử thai: Việc kiểm\
259
+ \ tra nồng độ hormone hCG (human chorionic gonadotropin) trong máu có thể cung\
260
+ \ cấp thông tin quan trọng và bước đầu kiểm tra được chị em có đang mang thai\
261
+ \ hay không,\n – Siêu âm thai: Thông qua siêu âm để bác sĩ xác định vị trí, sự\
262
+ \ phát triển của thai ngoài tử cung và xác nhận chẩn đoán một cách chính xác.\n\
263
+ \ – Xét nghiệm máu có thể được sử dụng để kiểm tra mức độ hCG và các yếu tố khác\
264
+ \ trong máu, giúp chẩn đoán thai ngoài tử cung\n Ngoài ra, bác sĩ cũng sẽ đánh\
265
+ \ giá các triệu chứng lâm sàng như đau vùng bụng dưới, chảy máu âm đạo, và cảm\
266
+ \ giác đau khi quan hệ tình dục để đưa ra kết quả đầy đủ về tình trạng sức khỏe.\n\
267
+ \ 2. Thai ngoài tử cung được điều trị bằng cách nào?\n Khối thai nằm ngoài tử\
268
+ \ cung không thể di chuyển về lại tử cung và cũng không thể tiếp tục phát triển\
269
+ \ như thai bình thường. Chính vì thế cần phải loại bỏ sớm để tránh các biến chứng\
270
+ \ nguy hiểm có thể xảy ra. Tùy vào mỗi trường hợp cụ thể mà bác sĩ sẽ chỉ định\
271
+ \ phương pháp điều trị khối thai ngoài tử cung.\n – Điều trị nội khoa: Bác sĩ\
272
+ \ có thể chỉ định điều trị bằng thuốc Methotrexate để ngăn chặn sự phát triển\
273
+ \ của tế bào và kết thúc thai kỳ, thuốc thường được áp dụng cho các trường hợp\
274
+ \ có giai đoạn thai ngoài tử cung chưa phát triển lớn, kích thước nhỏ.\n – Phẫu\
275
+ \ thuật nội soi: Bác sĩ sẽ áp dụng phương pháp này trong trường hợp mang thai\
276
+ \ ở ngoài tử cung đã phát triển nhưng chưa bị vỡ. Tùy vào từng trường hợp sẽ phải\
277
+ \ loại bỏ cả khối thai ngoài tử cung lẫn vòi trứng, hoặc bảo tồn vòi trứng."
278
+ - source_sentence: Mục đích chính của T0 là gì?
279
+ sentences:
280
+ - "Sâu răng càng nặng, răng sẽ càng chịu nhiều tổn thương. Thậm chí, nếu không được\
281
+ \ điều trị sớm, sâu răng sẽ tấn công và khiến cho rằng hàm vỡ hết chỉ còn chân\
282
+ \ răng.\n 2. Mức độ nguy hiểm của răng hàm vỡ chỉ còn chân răng\n Tình trạng răng\
283
+ \ cối bị sâu dẫn tới vỡ chỉ còn chân răng rất nguy hiểm. Nếu không được chăm sóc\
284
+ \ và điều trị kịp thời sẽ dẫn tới nhiều biến chứng gây ảnh hưởng nghiêm trọng\
285
+ \ tới sức khỏe người bệnh.\n 2.1 Ảnh hưởng chức năng ăn nhai của răng\n Khi tổ\
286
+ \ chức cứng của răng bị phá hủy càng nhiều, răng sẽ càng dễ vỡ. Thời điểm răng\
287
+ \ chỉ còn lại chân, chức năng ăn nhai của răng cũng sẽ mất.\n 2.2 Viêm lợi\n Sâu\
288
+ \ răng sẽ tạo ra những lỗ, hốc sâu. Đây chính là vị trí thuận lợi để răng sâu\
289
+ \ lưu giữ thức ăn. Lâu ngày, điều này sẽ dẫn tới hình thành ổ vi khuẩn, gây hôi\
290
+ \ miệng. Bên cạnh đó, khi răng xuất hiện hốc sâu, lợi sẽ dễ có xu hướng lấp kín\
291
+ \ hốc sâu đó. Phần lợi này sẽ dễ bị viêm, sưng, chảy máu cho phải chà sát nhiều\
292
+ \ trong quá trình ăn nhai.\n 2.3 Viêm tủy, nhiễm trùng chóp răng\n Khi tình trạng\
293
+ \ sâu răng hàm chuyển biến nặng sẽ dẫn tới đau nhức, viêm tủy, viêm chóp răng\
294
+ \ gây nguy hiểm\n Sâu răng khi chuyển nặng, sâu xuống dưới và vào tủy sẽ khiến\
295
+ \ răng bị đau nhức do viêm tủy. Khi tình trạng viêm tủy trở nên nghiêm trọng,\
296
+ \ lan sâu xuống chóp răng sẽ gây viêm nhiễm vùng chóp. Khi này, răng sẽ bị đau,\
297
+ \ lung lay, phần lợi xung quang sẽ sưng to. Lâu ngày, ổ abscess chóp răng sẽ hình\
298
+ \ thành. Vấn đề này không được xử lý sớm sẽ chính là nguy cơ mất răng và lây lan\
299
+ \ sang cả những răng lân cận.\n Ổ nhiễm trùng chóp răng lây lan sẽ gây viêm xương\
300
+ \ hàm. Sau đó, nếu không được khắc phục, phần mềm và các tổ chức lân cận cũng\
301
+ \ sẽ bị ảnh hưởng tạo nên ổ nhiễm trùng lớn rất khó để kiểm soát.\n Khi ổ nhiễm\
302
+ \ trùng lan rộng sẽ tạo ra nang to. Chúng phá hủy xương hàm và khiến xương hàm\
303
+ \ bị gãy, gây tổn thương thần kinh, đường mạch máu, …\n 3."
304
+ - "Có nhiều hình thái bệnh biểu thị mức độ nặng nhẹ khác nhau. Thông thường có 3\
305
+ \ hình thái biểu hiện bệnh nhẹ tới nặng như sau:\n– Mi mắt dưới sưng đỏ, nổi cục,\
306
+ \ có vảy, cảm giác vướng mí nhẹ. Triệu chứng này có thể xuất hiện ở bên trong\
307
+ \ hoặc bên ngoài mí mắt dưới\n– Các nốt nổi gây ngứa, sưng đỏ, tiết nhiều tiết\
308
+ \ tố khiến mi bị bám dính. Lúc này bờ mi chưa bị loét\n– Mí mắt tấy đỏ, ngứa,\
309
+ \ đau rát, bắt đầu có các vết loét\nBệnh không gây giảm, mất thị lực hay các hậu\
310
+ \ quả nghiêm trọng nhưng lại dễ tái phát gây khó chịu. Cần phát hiện kịp thời\
311
+ \ các dấu hiệu bất thường để có phương án điều trị phù hợp và nhanh chóng. Nếu\
312
+ \ để bệnh dai dẳng dễ trở thành tiền đề, tạo điều kiện cho các bệnh lý khác tấn\
313
+ \ công đôi mắt bạn.\n 3. Điều trị viêm mí mắt khoa học\n 3.1. Biện pháp vệ sinh,\
314
+ \ hạn chế tình trạng viêm mí mắt dưới nặng hơn\n Như đã đề cập, cần phát hiện\
315
+ \ sớm các dấu hiệu để có các biện pháp điều trị kịp thời, hạn chế các tác động\
316
+ \ tiêu cực lên mắt. Tùy vào chuyển biến của bệnh mà bạn có thể lựa chọn các phương\
317
+ \ pháp điều trị phù hợp, đồng thời thực hiện các biện pháp dưới đây:\n– Dùng kính\
318
+ \ bảo hộ tránh tác động của khói bụi. Dừng sử dụng kính áp tròng với mục đích\
319
+ \ làm đẹp và sử dụng kính gọng thông thường thay thế trong trường hợp mắc cận\
320
+ \ thị, viễn thị, loạn thị,…\n– Vệ sinh mi mắt bằng các vật dụng y tế như gạc,\
321
+ \ bông,�� tránh sử dụng các loại khăn chà sát. Chú ý rửa bằng nước muối sinh lý,\
322
+ \ nước ấm giúp bong lớp vảy và giảm tiết nhờn\n– Dùng khăn ấm chườm lên vùng mí\
323
+ \ mắt bị sưng viêm\nTuy nhiên, nếu bạn đã cố gắng đảm bảo giữ mi mắt sạch sẽ mà\
324
+ \ tình trạng viêm mí mắt dưới vẫn có chiều hướng nặng hơn thì hãy gặp các bác\
325
+ \ sĩ chuyên khoa\n Bệnh nhân nên lựa chọn cơ sở y tế uy tín điều trị bệnh.\n 3.2.\
326
+ \ Điều trị bệnh viêm mí mắt dưới an toàn hơn khi gặp bác sĩ\n Các bác sĩ sẽ tư\
327
+ \ vấn và có hướng điều trị tốt hơn như:\n– Sử dụng các loại kháng sinh dạng thuốc\
328
+ \ nhỏ mắt hoặc thuốc mỡ bôi."
329
+ - Mục đích của T0 này là so sánh hiệu quả của bài tập chuyển động thụ động và bài
330
+ tập chuyển động AS đối với sức khỏe chức năng ở các đối tượng và phương pháp của
331
+ cư dân viện dưỡng lão cao tuổi. Hai mươi ba cư dân tại viện dưỡng lão nam và nữ
332
+ tình nguyện tham gia T0 này, họ được chia thành một nhóm thụ động nhóm tập thể
333
+ dục chuyển động n và một nhóm tập thể dục chuyển động AS n và thực hiện các buổi
334
+ tập tối thiểu hai lần một tuần trong nhiều tuần ghế tập thể hình PET đứng lên
335
+ ngồi vươn tay ra sau Các bài kiểm tra FR và đi bộ tối thiểu đã được đánh giá trước
336
+ đó và T3 kết quả can thiệp không có đường cơ sở đáng kể sự khác biệt được ghi
337
+ nhận giữa các nhóm về các biến đo được sau can thiệp trong tuần không có nhóm
338
+ tương tác đáng kể nào à thời gian được ghi nhận trong các biến thể dục chức năng
339
+ giữa CG ngoại trừ điểm FR Bài tập chuyển động AS Bài tập chuyển động thụ động
340
+ cải thiện đáng kể theo thời gian đã được ghi nhận trong bài tập chuyển động thụ
341
+ động nhóm ngồi trên ghế cong đứng lên điểm đi bộ và đi bộ tối thiểu và trong nhóm
342
+ tập thể dục chuyển động tích cực ngồi trên ghế cong đứng lên điểm đi bộ FR và
343
+ đi bộ tối thiểu tỷ lệ tuân thủ trong các nhóm tập thể dục thụ động và chuyển động
344
+ AS lần lượt là kết luận bài tập chuyển động thụ động và bài tập chuyển động tích
345
+ cực được cho là có hiệu quả tương tự trong việc cải thiện thể lực PET của người
346
+ già ở viện dưỡng lão
347
+ ---
348
+
349
+ # SentenceTransformer based on BAAI/bge-m3
350
+
351
+ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [BAAI/bge-m3](https://huggingface.co/BAAI/bge-m3). It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
352
+
353
+ ## Model Details
354
+
355
+ ### Model Description
356
+ - **Model Type:** Sentence Transformer
357
+ - **Base model:** [BAAI/bge-m3](https://huggingface.co/BAAI/bge-m3) <!-- at revision 5617a9f61b028005a4858fdac845db406aefb181 -->
358
+ - **Maximum Sequence Length:** 8192 tokens
359
+ - **Output Dimensionality:** 1024 dimensions
360
+ - **Similarity Function:** Cosine Similarity
361
+ <!-- - **Training Dataset:** Unknown -->
362
+ <!-- - **Language:** Unknown -->
363
+ <!-- - **License:** Unknown -->
364
+
365
+ ### Model Sources
366
+
367
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
368
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
369
+ - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
370
+
371
+ ### Full Model Architecture
372
+
373
+ ```
374
+ SentenceTransformer(
375
+ (0): Transformer({'max_seq_length': 8192, 'do_lower_case': False}) with Transformer model: XLMRobertaModel
376
+ (1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': True, 'pooling_mode_mean_tokens': False, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
377
+ (2): Normalize()
378
+ )
379
+ ```
380
+
381
+ ## Usage
382
+
383
+ ### Direct Usage (Sentence Transformers)
384
+
385
+ First install the Sentence Transformers library:
386
+
387
+ ```bash
388
+ pip install -U sentence-transformers
389
+ ```
390
+
391
+ Then you can load this model and run inference.
392
+ ```python
393
+ from sentence_transformers import SentenceTransformer
394
+
395
+ # Download from the 🤗 Hub
396
+ model = SentenceTransformer("strongpear/M3-retriever-Medical")
397
+ # Run inference
398
+ sentences = [
399
+ 'Mục đích chính của T0 là gì?',
400
+ 'Mục đích của T0 này là so sánh hiệu quả của bài tập chuyển động thụ động và bài tập chuyển động AS đối với sức khỏe chức năng ở các đối tư��ng và phương pháp của cư dân viện dưỡng lão cao tuổi. Hai mươi ba cư dân tại viện dưỡng lão nam và nữ tình nguyện tham gia T0 này, họ được chia thành một nhóm thụ động nhóm tập thể dục chuyển động n và một nhóm tập thể dục chuyển động AS n và thực hiện các buổi tập tối thiểu hai lần một tuần trong nhiều tuần ghế tập thể hình PET đứng lên ngồi vươn tay ra sau Các bài kiểm tra FR và đi bộ tối thiểu đã được đánh giá trước đó và T3 kết quả can thiệp không có đường cơ sở đáng kể sự khác biệt được ghi nhận giữa các nhóm về các biến đo được sau can thiệp trong tuần không có nhóm tương tác đáng kể nào à thời gian được ghi nhận trong các biến thể dục chức năng giữa CG ngoại trừ điểm FR Bài tập chuyển động AS Bài tập chuyển động thụ động cải thiện đáng kể theo thời gian đã được ghi nhận trong bài tập chuyển động thụ động nhóm ngồi trên ghế cong đứng lên điểm đi bộ và đi bộ tối thiểu và trong nhóm tập thể dục chuyển động tích cực ngồi trên ghế cong đứng lên điểm đi bộ FR và đi bộ tối thiểu tỷ lệ tuân thủ trong các nhóm tập thể dục thụ động và chuyển động AS lần lượt là kết luận bài tập chuyển động thụ động và bài tập chuyển động tích cực được cho là có hiệu quả tương tự trong việc cải thiện thể lực PET của người già ở viện dưỡng lão',
401
+ 'Sâu răng càng nặng, răng sẽ càng chịu nhiều tổn thương. Thậm chí, nếu không được điều trị sớm, sâu răng sẽ tấn công và khiến cho rằng hàm vỡ hết chỉ còn chân răng.\n 2. Mức độ nguy hiểm của răng hàm vỡ chỉ còn chân răng\n Tình trạng răng cối bị sâu dẫn tới vỡ chỉ còn chân răng rất nguy hiểm. Nếu không được chăm sóc và điều trị kịp thời sẽ dẫn tới nhiều biến chứng gây ảnh hưởng nghiêm trọng tới sức khỏe người bệnh.\n 2.1 Ảnh hưởng chức năng ăn nhai của răng\n Khi tổ chức cứng của răng bị phá hủy càng nhiều, răng sẽ càng dễ vỡ. Thời điểm răng chỉ còn lại chân, chức năng ăn nhai của răng cũng sẽ mất.\n 2.2 Viêm lợi\n Sâu răng sẽ tạo ra những lỗ, hốc sâu. Đây chính là vị trí thuận lợi để răng sâu lưu giữ thức ăn. Lâu ngày, điều này sẽ dẫn tới hình thành ổ vi khuẩn, gây hôi miệng. Bên cạnh đó, khi răng xuất hiện hốc sâu, lợi sẽ dễ có xu hướng lấp kín hốc sâu đó. Phần lợi này sẽ dễ bị viêm, sưng, chảy máu cho phải chà sát nhiều trong quá trình ăn nhai.\n 2.3 Viêm tủy, nhiễm trùng chóp răng\n Khi tình trạng sâu răng hàm chuyển biến nặng sẽ dẫn tới đau nhức, viêm tủy, viêm chóp răng gây nguy hiểm\n Sâu răng khi chuyển nặng, sâu xuống dưới và vào tủy sẽ khiến răng bị đau nhức do viêm tủy. Khi tình trạng viêm tủy trở nên nghiêm trọng, lan sâu xuống chóp răng sẽ gây viêm nhiễm vùng chóp. Khi này, răng sẽ bị đau, lung lay, phần lợi xung quang sẽ sưng to. Lâu ngày, ổ abscess chóp răng sẽ hình thành. Vấn đề này không được xử lý sớm sẽ chính là nguy cơ mất răng và lây lan sang cả những răng lân cận.\n Ổ nhiễm trùng chóp răng lây lan sẽ gây viêm xương hàm. Sau đó, nếu không được khắc phục, phần mềm và các tổ chức lân cận cũng sẽ bị ảnh hưởng tạo nên ổ nhiễm trùng lớn rất khó để kiểm soát.\n Khi ổ nhiễm trùng lan rộng sẽ tạo ra nang to. Chúng phá hủy xương hàm và khiến xương hàm bị gãy, gây tổn thương thần kinh, đường mạch máu, …\n 3.',
402
+ ]
403
+ embeddings = model.encode(sentences)
404
+ print(embeddings.shape)
405
+ # [3, 1024]
406
+
407
+ # Get the similarity scores for the embeddings
408
+ similarities = model.similarity(embeddings, embeddings)
409
+ print(similarities.shape)
410
+ # [3, 3]
411
+ ```
412
+
413
+ <!--
414
+ ### Direct Usage (Transformers)
415
+
416
+ <details><summary>Click to see the direct usage in Transformers</summary>
417
+
418
+ </details>
419
+ -->
420
+
421
+ <!--
422
+ ### Downstream Usage (Sentence Transformers)
423
+
424
+ You can finetune this model on your own dataset.
425
+
426
+ <details><summary>Click to expand</summary>
427
+
428
+ </details>
429
+ -->
430
+
431
+ <!--
432
+ ### Out-of-Scope Use
433
+
434
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
435
+ -->
436
+
437
+ <!--
438
+ ## Bias, Risks and Limitations
439
+
440
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
441
+ -->
442
+
443
+ <!--
444
+ ### Recommendations
445
+
446
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
447
+ -->
448
+
449
+ ## Training Details
450
+
451
+ ### Training Dataset
452
+
453
+ #### Unnamed Dataset
454
+
455
+
456
+ * Size: 123,750 training samples
457
+ * Columns: <code>anchor</code> and <code>positive</code>
458
+ * Approximate statistics based on the first 1000 samples:
459
+ | | anchor | positive |
460
+ |:--------|:-----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
461
+ | type | string | string |
462
+ | details | <ul><li>min: 10 tokens</li><li>mean: 19.64 tokens</li><li>max: 48 tokens</li></ul> | <ul><li>min: 19 tokens</li><li>mean: 396.68 tokens</li><li>max: 735 tokens</li></ul> |
463
+ * Samples:
464
+ | anchor | positive |
465
+ |:----------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
466
+ | <code>Manh tràng có hình dạng và vị trí như thế nào trong đại tràng?</code> | <code>Giải phẫu học về túi thừa đại tràng<br>Bài viết được viết bởi Bác sĩ Mai Viễn Phương - Khoa Khám bệnh & Nội Khoa - Bệnh viện Đa khoa Quốc tế Vinmec Central Park<br>Để hiểu rõ về bệnh túi thừa đại tràng và viêm túi thừa đại tràng, cần nắm vững về giải phẫu học và chức năng của ruột. Ruột non là đoạn ruột mảnh và dài bắt đầu từ dạ dày và kết thúc ở ruột già hoặc đại tràng. Đại tràng bắt đầu từ vùng hố chậu phải, có hình dạng một dấu hỏi lớn bắc ngang qua khắp ổ bụng và kết thúc ở trực tràng<br>1. Cấu tạo của đại tràng<br>Đại tràng chia làm 3 phần chính: manh tràng, kết tràng và trực tràng. Ruột non thông với ruột già tại ranh giới giữa manh tràng và kết tràng. Giữa ruột non và ruột già có van hồi manh tràng giữ cho các chất trong ruột già không chảy ngược lại lên ruột non.<br>Cấu tạo của đại trực tràng<br>Manh tràng. Hình dạng giống một chiếc túi hình tròn, vị trí của nó nằm ở ngay phía dưới của hỗng tràng được đổ vào bên trong ruột già. Manh tràng được liên kết với ruột thừa có hình dạng gần giống với ng...</code> |
467
+ | <code>Chấn thương tụy có thể gây ra những vấn đề gì?</code> | <code>Chấn thương<br>Những sang chấn bên ngoài hay tổn thương trực tiếp vào tuyến tụy làm phá vỡ cấu trúc của tế bào, giải thoát dịch tụy ra ngoài, không chỉ gây viêm tụy cấp mà còn tổn thương các tạng xung quanh, viêm phúc mạc.Do tụy nằm kín đáo phía sau phúc mạc, mọi sang chấn có ảnh hưởng cả tụy thì mức độ thường nặng nề, điều trị khó khăn. Yêu cầu phẫu thuật khẩn cấp luôn được đặt ra để cầm máu, bảo tồn các tạng, làm sạch ổ bụng cũng như cứu giữ tính mạng.<br>11. Tụy chia đôi<br>Đây là một bất thường giải phẫu trong thời kỳ bào thai khiến tụy không sáp nhập mà thành hai tuyến tụy riêng biệt với ống bài tiết độc lập.Tuy nhiên, phát hiện này chỉ biết được khi khám nghiệm tử thi và cơ chế gây viêm tụy cũng chưa được biết rõ ràng.<br>12. Bệnh lý mạch máu<br>Tương tự như các cơ quan khác, tuyến tụy cũng được nuôi dưỡng bởi hệ thống mạch máu nuôi. Vì vậy, mọi bệnh lý trên mạch máu đều có thể ảnh hưởng đến chức năng tụy.Trong đó, thiếu máu cục bộ tụy là một nguyên nhân hiếm gặp của viêm tụy cấp nhưng lại rất ...</code> |
468
+ | <code>Hình ảnh nội soi NBI có điểm gì nổi bật so với nội soi thông thường?</code> | <code>Hình ảnh nội soi NBI có độ phân giải và độ phân giải cao nên giúp bác sỹ dễ dàng phát hiện những thay đổi nhỏ về màu sắc, hình thái của tổn thương ung thư và tiền ung thư mà nội soi thông thường khó phát hiện được.Ngoài ra, nội soi đại trực tràng và mọi quy trình kỹ thuật khác thực hiện tại Vinmec đều được kiểm soát nghiêm ngặt, đạt các tiêu chuẩn chất lượng quốc tế, đảm bảo an toàn và chất lượng cho người bệnh.Trước mỗi ca thực hiện, hệ thống máy nội soi đều được đảm bảo vô trùng, đem đến tính an toàn tuyệt đối đến người bệnh. Sau khi thủ thuật kết thúc, ống nội soi được vệ sinh bằng máy rửa dây soi tự động của chính hãng Olympus dưới hệ thống lọc nước RO.<br>Để đặt lịch khám tại viện, Quý khách vui lòng bấm số<br>HOTLINE<br>hoặc đặt lịch trực tiếp TẠI ĐÂY.<br>Tải và đặt lịch khám tự động trên ứng dụng My. Vinmec để quản lý, theo dõi lịch và đặt hẹn mọi lúc mọi nơi ngay trên ứng dụng.</code> |
469
+ * Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
470
+ ```json
471
+ {
472
+ "scale": 20.0,
473
+ "similarity_fct": "cos_sim"
474
+ }
475
+ ```
476
+
477
+ ### Evaluation Dataset
478
+
479
+ #### Unnamed Dataset
480
+
481
+
482
+ * Size: 1,250 evaluation samples
483
+ * Columns: <code>anchor</code> and <code>positive</code>
484
+ * Approximate statistics based on the first 1000 samples:
485
+ | | anchor | positive |
486
+ |:--------|:-----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
487
+ | type | string | string |
488
+ | details | <ul><li>min: 10 tokens</li><li>mean: 19.71 tokens</li><li>max: 58 tokens</li></ul> | <ul><li>min: 17 tokens</li><li>mean: 396.06 tokens</li><li>max: 632 tokens</li></ul> |
489
+ * Samples:
490
+ | anchor | positive |
491
+ |:-------------------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
492
+ | <code>Moxonidine có tác dụng gì đối với bệnh tăng huyết áp?</code> | <code>sử dụng trong thận nó là AS chống lại rối loạn nhịp tim VVI trong nhiều môi trường kinh nghiệm khác nhau nó không có tác dụng ức chế hô hấp do kích hoạt CE alpha nó có tác dụng có lợi đối với chuyển hóa thủy tinh và lipid máu ở chuột béo phì bị tăng huyết áp di truyền nó thể hiện hoạt động chống loét và cuối cùng là moxonidine làm giảm áp lực nội nhãn gợi ý một lợi ích có thể có trong bệnh tăng nhãn áp do đó MOX bằng phương thức hoạt động mới của nó thể hiện một nguyên tắc điều trị mới trong điều trị tăng huyết áp vì đặc tính độc đáo của nó. MOX có thể chứng minh là có hiệu quả trong việc làm chậm sự tiến triển của bệnh bằng cách mang lại tác dụng bảo vệ ngoài việc chỉ giảm huyết áp cần nghiên cứu thêm để xác minh tiềm năng này</code> |
493
+ | <code>Tại sao bác sĩ Haydar Cemal lại đưa ra tuyên bố về việc tiêm chủng cho những người bị kết án tử hình?</code> | <code>vắc-xin để tiêm chủng tuyệt đối cho một số đối tượng bị kết án tử hình, bác sĩ haydar cemal tuyên bố trên một tờ báo ngày tháng 12 rằng những người được báo cáo là đối tượng bị kết án tử hình thực sự là người Armenia và những người Armenia vô tội bị đánh dấu trục xuất đã được tiêm máu của bệnh nhân sốt phát ban và rằng anh ta đã chứng kiến ​​​​tất cả những sự kiện này do lời khai của anh ta, Bộ Nội vụ đã yêu cầu một cuộc điều tra ngay lập tức và khi kết thúc cuộc điều tra đó, người ta hiểu rằng bác sĩ haydar cemal và bác sĩ hamdi suat chưa bao giờ làm việc cùng nhau ở erzincan vào thời điểm bác sĩ haydar cemal tuyên bố tất cả các tuyên bố đều bị EC điều tra bác bỏ và không ai bị buộc tội trong một trận dịch sốt phát ban nghiêm trọng. Các bác sĩ Thổ Nhĩ Kỳ đã tiêm vắc xin sốt phát ban nhằm mục đích cứu một mạng sống khỏi đám cháy. Theo các nguồn tin, sự phân biệt đối xử tôn giáo đối với những người được tiêm chủng đã được chứng minh rằng tuyên bố rằng một số bác sĩ Thổ Nhĩ Kỳ đã sử dụng...</code> |
494
+ | <code>Sinh thiết ảnh hưởng đến quyết định lâm sàng như thế nào trong giai đoạn đầu sau ghép gan?</code> | <code>PLB thông thường trong giai đoạn hậu phẫu sớm trong vòng vài ngày sau khi ghép CL có thể không thực hiện được do bệnh lý đông máu và/hoặc cổ trướng việc sử dụng sinh thiết VG gan xuyên tĩnh mạch cảnh tjlb trong trường hợp này là một phương pháp thay thế hấp dẫn vì có thể thu được chẩn đoán mô mặc dù có chống chỉ định tương đối đối với sinh thiết qua da trong giai đoạn này trong giai đoạn đầu sau ghép tjlb đã được thực hiện ở những bệnh nhân gan phần lớn trong số họ đã ghép gan thông thường mà không bảo tồn VPI VC bản địa những người khác đã có IVC bản địa trong tỷ lệ thành công về mặt kỹ thuật là với mẫu bệnh phẩm đủ để chẩn đoán xác định trong hầu hết các trường hợp bao gồm cả chẩn đoán đào thải và không đào thải trên mô bệnh học cuối cùng chẩn đoán sinh thiết ảnh hưởng đến việc xử trí lâm sàng trong phần lớn các trường hợp với các quyết định được đưa ra để thực hiện ghép lại để ảnh hưởng đến việc bắt đầu liệu pháp chống đào thải và bắt đầu liệu pháp kháng vi-rút không có bệnh tật hoặ...</code> |
495
+ * Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
496
+ ```json
497
+ {
498
+ "scale": 20.0,
499
+ "similarity_fct": "cos_sim"
500
+ }
501
+ ```
502
+
503
+ ### Training Hyperparameters
504
+ #### Non-Default Hyperparameters
505
+
506
+ - `eval_strategy`: steps
507
+ - `per_device_train_batch_size`: 32
508
+ - `per_device_eval_batch_size`: 32
509
+ - `warmup_ratio`: 0.1
510
+ - `bf16`: True
511
+ - `batch_sampler`: no_duplicates
512
+
513
+ #### All Hyperparameters
514
+ <details><summary>Click to expand</summary>
515
+
516
+ - `overwrite_output_dir`: False
517
+ - `do_predict`: False
518
+ - `eval_strategy`: steps
519
+ - `prediction_loss_only`: True
520
+ - `per_device_train_batch_size`: 32
521
+ - `per_device_eval_batch_size`: 32
522
+ - `per_gpu_train_batch_size`: None
523
+ - `per_gpu_eval_batch_size`: None
524
+ - `gradient_accumulation_steps`: 1
525
+ - `eval_accumulation_steps`: None
526
+ - `torch_empty_cache_steps`: None
527
+ - `learning_rate`: 5e-05
528
+ - `weight_decay`: 0.0
529
+ - `adam_beta1`: 0.9
530
+ - `adam_beta2`: 0.999
531
+ - `adam_epsilon`: 1e-08
532
+ - `max_grad_norm`: 1.0
533
+ - `num_train_epochs`: 3
534
+ - `max_steps`: -1
535
+ - `lr_scheduler_type`: linear
536
+ - `lr_scheduler_kwargs`: {}
537
+ - `warmup_ratio`: 0.1
538
+ - `warmup_steps`: 0
539
+ - `log_level`: passive
540
+ - `log_level_replica`: warning
541
+ - `log_on_each_node`: True
542
+ - `logging_nan_inf_filter`: True
543
+ - `save_safetensors`: True
544
+ - `save_on_each_node`: False
545
+ - `save_only_model`: False
546
+ - `restore_callback_states_from_checkpoint`: False
547
+ - `no_cuda`: False
548
+ - `use_cpu`: False
549
+ - `use_mps_device`: False
550
+ - `seed`: 42
551
+ - `data_seed`: None
552
+ - `jit_mode_eval`: False
553
+ - `use_ipex`: False
554
+ - `bf16`: True
555
+ - `fp16`: False
556
+ - `fp16_opt_level`: O1
557
+ - `half_precision_backend`: auto
558
+ - `bf16_full_eval`: False
559
+ - `fp16_full_eval`: False
560
+ - `tf32`: None
561
+ - `local_rank`: 0
562
+ - `ddp_backend`: None
563
+ - `tpu_num_cores`: None
564
+ - `tpu_metrics_debug`: False
565
+ - `debug`: []
566
+ - `dataloader_drop_last`: False
567
+ - `dataloader_num_workers`: 0
568
+ - `dataloader_prefetch_factor`: None
569
+ - `past_index`: -1
570
+ - `disable_tqdm`: False
571
+ - `remove_unused_columns`: True
572
+ - `label_names`: None
573
+ - `load_best_model_at_end`: False
574
+ - `ignore_data_skip`: False
575
+ - `fsdp`: []
576
+ - `fsdp_min_num_params`: 0
577
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
578
+ - `fsdp_transformer_layer_cls_to_wrap`: None
579
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
580
+ - `deepspeed`: None
581
+ - `label_smoothing_factor`: 0.0
582
+ - `optim`: adamw_torch
583
+ - `optim_args`: None
584
+ - `adafactor`: False
585
+ - `group_by_length`: False
586
+ - `length_column_name`: length
587
+ - `ddp_find_unused_parameters`: None
588
+ - `ddp_bucket_cap_mb`: None
589
+ - `ddp_broadcast_buffers`: False
590
+ - `dataloader_pin_memory`: True
591
+ - `dataloader_persistent_workers`: False
592
+ - `skip_memory_metrics`: True
593
+ - `use_legacy_prediction_loop`: False
594
+ - `push_to_hub`: False
595
+ - `resume_from_checkpoint`: None
596
+ - `hub_model_id`: None
597
+ - `hub_strategy`: every_save
598
+ - `hub_private_repo`: False
599
+ - `hub_always_push`: False
600
+ - `gradient_checkpointing`: False
601
+ - `gradient_checkpointing_kwargs`: None
602
+ - `include_inputs_for_metrics`: False
603
+ - `eval_do_concat_batches`: True
604
+ - `fp16_backend`: auto
605
+ - `push_to_hub_model_id`: None
606
+ - `push_to_hub_organization`: None
607
+ - `mp_parameters`:
608
+ - `auto_find_batch_size`: False
609
+ - `full_determinism`: False
610
+ - `torchdynamo`: None
611
+ - `ray_scope`: last
612
+ - `ddp_timeout`: 1800
613
+ - `torch_compile`: False
614
+ - `torch_compile_backend`: None
615
+ - `torch_compile_mode`: None
616
+ - `dispatch_batches`: None
617
+ - `split_batches`: None
618
+ - `include_tokens_per_second`: False
619
+ - `include_num_input_tokens_seen`: False
620
+ - `neftune_noise_alpha`: None
621
+ - `optim_target_modules`: None
622
+ - `batch_eval_metrics`: False
623
+ - `eval_on_start`: False
624
+ - `use_liger_kernel`: False
625
+ - `eval_use_gather_object`: False
626
+ - `prompts`: None
627
+ - `batch_sampler`: no_duplicates
628
+ - `multi_dataset_batch_sampler`: proportional
629
+
630
+ </details>
631
+
632
+ ### Training Logs
633
+ | Epoch | Step | Training Loss | Validation Loss |
634
+ |:------:|:-----:|:-------------:|:---------------:|
635
+ | 0.0517 | 200 | 0.1317 | 0.0428 |
636
+ | 0.1034 | 400 | 0.0646 | 0.0437 |
637
+ | 0.1551 | 600 | 0.063 | 0.0416 |
638
+ | 0.2068 | 800 | 0.0623 | 0.0441 |
639
+ | 0.2585 | 1000 | 0.0752 | 0.0475 |
640
+ | 0.3102 | 1200 | 0.0754 | 0.0491 |
641
+ | 0.3619 | 1400 | 0.0794 | 0.0507 |
642
+ | 0.4137 | 1600 | 0.0849 | 0.0658 |
643
+ | 0.4654 | 1800 | 0.076 | 0.0503 |
644
+ | 0.5171 | 2000 | 0.0778 | 0.0490 |
645
+ | 0.5688 | 2200 | 0.0747 | 0.0455 |
646
+ | 0.6205 | 2400 | 0.0601 | 0.0412 |
647
+ | 0.6722 | 2600 | 0.0664 | 0.0458 |
648
+ | 0.7239 | 2800 | 0.0628 | 0.0430 |
649
+ | 0.7756 | 3000 | 0.067 | 0.0500 |
650
+ | 0.8273 | 3200 | 0.0655 | 0.0501 |
651
+ | 0.8790 | 3400 | 0.0626 | 0.0577 |
652
+ | 0.9307 | 3600 | 0.0731 | 0.0512 |
653
+ | 0.9824 | 3800 | 0.0662 | 0.0443 |
654
+ | 1.0341 | 4000 | 0.056 | 0.0428 |
655
+ | 1.0858 | 4200 | 0.0496 | 0.0378 |
656
+ | 1.1375 | 4400 | 0.0405 | 0.0360 |
657
+ | 1.1892 | 4600 | 0.0333 | 0.0318 |
658
+ | 1.2410 | 4800 | 0.0326 | 0.0313 |
659
+ | 1.2927 | 5000 | 0.0273 | 0.0321 |
660
+ | 1.3444 | 5200 | 0.0254 | 0.0334 |
661
+ | 1.3961 | 5400 | 0.0261 | 0.0291 |
662
+ | 1.4478 | 5600 | 0.0228 | 0.0359 |
663
+ | 1.4995 | 5800 | 0.0247 | 0.0344 |
664
+ | 1.5512 | 6000 | 0.0216 | 0.0344 |
665
+ | 1.6029 | 6200 | 0.0183 | 0.0303 |
666
+ | 1.6546 | 6400 | 0.0205 | 0.0294 |
667
+ | 1.7063 | 6600 | 0.0194 | 0.0294 |
668
+ | 1.7580 | 6800 | 0.018 | 0.0258 |
669
+ | 1.8097 | 7000 | 0.0197 | 0.0296 |
670
+ | 1.8614 | 7200 | 0.0196 | 0.0340 |
671
+ | 1.9131 | 7400 | 0.0207 | 0.0284 |
672
+ | 1.9648 | 7600 | 0.0234 | 0.0268 |
673
+ | 2.0165 | 7800 | 0.0139 | 0.0275 |
674
+ | 2.0683 | 8000 | 0.015 | 0.0270 |
675
+ | 2.1200 | 8200 | 0.0103 | 0.0293 |
676
+ | 2.1717 | 8400 | 0.0095 | 0.0259 |
677
+ | 2.2234 | 8600 | 0.0082 | 0.0284 |
678
+ | 2.2751 | 8800 | 0.0077 | 0.0264 |
679
+ | 2.3268 | 9000 | 0.0073 | 0.0252 |
680
+ | 2.3785 | 9200 | 0.0078 | 0.0247 |
681
+ | 2.4302 | 9400 | 0.0074 | 0.0294 |
682
+ | 2.4819 | 9600 | 0.0059 | 0.0324 |
683
+ | 2.5336 | 9800 | 0.007 | 0.0321 |
684
+ | 2.5853 | 10000 | 0.005 | 0.0299 |
685
+ | 2.6370 | 10200 | 0.0062 | 0.0283 |
686
+ | 2.6887 | 10400 | 0.0059 | 0.0277 |
687
+ | 2.7404 | 10600 | 0.0053 | 0.0285 |
688
+ | 2.7921 | 10800 | 0.0049 | 0.0280 |
689
+ | 2.8438 | 11000 | 0.0055 | 0.0288 |
690
+ | 2.8956 | 11200 | 0.0046 | 0.0286 |
691
+ | 2.9473 | 11400 | 0.0072 | 0.0280 |
692
+ | 2.9990 | 11600 | 0.0046 | 0.0281 |
693
+
694
+
695
+ ### Framework Versions
696
+ - Python: 3.9.20
697
+ - Sentence Transformers: 3.3.1
698
+ - Transformers: 4.45.2
699
+ - PyTorch: 2.4.0+cu121
700
+ - Accelerate: 1.0.1
701
+ - Datasets: 3.0.0
702
+ - Tokenizers: 0.20.1
703
+
704
+ ## Citation
705
+
706
+ ### BibTeX
707
+
708
+ #### Sentence Transformers
709
+ ```bibtex
710
+ @inproceedings{reimers-2019-sentence-bert,
711
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
712
+ author = "Reimers, Nils and Gurevych, Iryna",
713
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
714
+ month = "11",
715
+ year = "2019",
716
+ publisher = "Association for Computational Linguistics",
717
+ url = "https://arxiv.org/abs/1908.10084",
718
+ }
719
+ ```
720
+
721
+ #### MultipleNegativesRankingLoss
722
+ ```bibtex
723
+ @misc{henderson2017efficient,
724
+ title={Efficient Natural Language Response Suggestion for Smart Reply},
725
+ author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
726
+ year={2017},
727
+ eprint={1705.00652},
728
+ archivePrefix={arXiv},
729
+ primaryClass={cs.CL}
730
+ }
731
+ ```
732
+
733
+ <!--
734
+ ## Glossary
735
+
736
+ *Clearly define terms in order to be accessible across audiences.*
737
+ -->
738
+
739
+ <!--
740
+ ## Model Card Authors
741
+
742
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
743
+ -->
744
+
745
+ <!--
746
+ ## Model Card Contact
747
+
748
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
749
+ -->
config.json ADDED
@@ -0,0 +1,28 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "_name_or_path": "BAAI/bge-m3",
3
+ "architectures": [
4
+ "XLMRobertaModel"
5
+ ],
6
+ "attention_probs_dropout_prob": 0.1,
7
+ "bos_token_id": 0,
8
+ "classifier_dropout": null,
9
+ "eos_token_id": 2,
10
+ "hidden_act": "gelu",
11
+ "hidden_dropout_prob": 0.1,
12
+ "hidden_size": 1024,
13
+ "initializer_range": 0.02,
14
+ "intermediate_size": 4096,
15
+ "layer_norm_eps": 1e-05,
16
+ "max_position_embeddings": 8194,
17
+ "model_type": "xlm-roberta",
18
+ "num_attention_heads": 16,
19
+ "num_hidden_layers": 24,
20
+ "output_past": true,
21
+ "pad_token_id": 1,
22
+ "position_embedding_type": "absolute",
23
+ "torch_dtype": "float32",
24
+ "transformers_version": "4.45.2",
25
+ "type_vocab_size": 1,
26
+ "use_cache": true,
27
+ "vocab_size": 250002
28
+ }
config_sentence_transformers.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "__version__": {
3
+ "sentence_transformers": "3.3.1",
4
+ "transformers": "4.45.2",
5
+ "pytorch": "2.4.0+cu121"
6
+ },
7
+ "prompts": {},
8
+ "default_prompt_name": null,
9
+ "similarity_fn_name": "cosine"
10
+ }
model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:5e42f3e4121fc4c60acd7a786b4794bc8d704b17393e919b4720bb2bc8e4688e
3
+ size 2271064456
modules.json ADDED
@@ -0,0 +1,20 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "",
6
+ "type": "sentence_transformers.models.Transformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_Pooling",
12
+ "type": "sentence_transformers.models.Pooling"
13
+ },
14
+ {
15
+ "idx": 2,
16
+ "name": "2",
17
+ "path": "2_Normalize",
18
+ "type": "sentence_transformers.models.Normalize"
19
+ }
20
+ ]
sentence_bert_config.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "max_seq_length": 8192,
3
+ "do_lower_case": false
4
+ }
sentencepiece.bpe.model ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:cfc8146abe2a0488e9e2a0c56de7952f7c11ab059eca145a0a727afce0db2865
3
+ size 5069051
special_tokens_map.json ADDED
@@ -0,0 +1,51 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "bos_token": {
3
+ "content": "<s>",
4
+ "lstrip": false,
5
+ "normalized": false,
6
+ "rstrip": false,
7
+ "single_word": false
8
+ },
9
+ "cls_token": {
10
+ "content": "<s>",
11
+ "lstrip": false,
12
+ "normalized": false,
13
+ "rstrip": false,
14
+ "single_word": false
15
+ },
16
+ "eos_token": {
17
+ "content": "</s>",
18
+ "lstrip": false,
19
+ "normalized": false,
20
+ "rstrip": false,
21
+ "single_word": false
22
+ },
23
+ "mask_token": {
24
+ "content": "<mask>",
25
+ "lstrip": true,
26
+ "normalized": false,
27
+ "rstrip": false,
28
+ "single_word": false
29
+ },
30
+ "pad_token": {
31
+ "content": "<pad>",
32
+ "lstrip": false,
33
+ "normalized": false,
34
+ "rstrip": false,
35
+ "single_word": false
36
+ },
37
+ "sep_token": {
38
+ "content": "</s>",
39
+ "lstrip": false,
40
+ "normalized": false,
41
+ "rstrip": false,
42
+ "single_word": false
43
+ },
44
+ "unk_token": {
45
+ "content": "<unk>",
46
+ "lstrip": false,
47
+ "normalized": false,
48
+ "rstrip": false,
49
+ "single_word": false
50
+ }
51
+ }
tokenizer.json ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:e4f7e21bec3fb0044ca0bb2d50eb5d4d8c596273c422baef84466d2c73748b9c
3
+ size 17083053
tokenizer_config.json ADDED
@@ -0,0 +1,55 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "added_tokens_decoder": {
3
+ "0": {
4
+ "content": "<s>",
5
+ "lstrip": false,
6
+ "normalized": false,
7
+ "rstrip": false,
8
+ "single_word": false,
9
+ "special": true
10
+ },
11
+ "1": {
12
+ "content": "<pad>",
13
+ "lstrip": false,
14
+ "normalized": false,
15
+ "rstrip": false,
16
+ "single_word": false,
17
+ "special": true
18
+ },
19
+ "2": {
20
+ "content": "</s>",
21
+ "lstrip": false,
22
+ "normalized": false,
23
+ "rstrip": false,
24
+ "single_word": false,
25
+ "special": true
26
+ },
27
+ "3": {
28
+ "content": "<unk>",
29
+ "lstrip": false,
30
+ "normalized": false,
31
+ "rstrip": false,
32
+ "single_word": false,
33
+ "special": true
34
+ },
35
+ "250001": {
36
+ "content": "<mask>",
37
+ "lstrip": true,
38
+ "normalized": false,
39
+ "rstrip": false,
40
+ "single_word": false,
41
+ "special": true
42
+ }
43
+ },
44
+ "bos_token": "<s>",
45
+ "clean_up_tokenization_spaces": true,
46
+ "cls_token": "<s>",
47
+ "eos_token": "</s>",
48
+ "mask_token": "<mask>",
49
+ "model_max_length": 8192,
50
+ "pad_token": "<pad>",
51
+ "sep_token": "</s>",
52
+ "sp_model_kwargs": {},
53
+ "tokenizer_class": "XLMRobertaTokenizer",
54
+ "unk_token": "<unk>"
55
+ }