hotamago commited on
Commit
ba2901b
1 Parent(s): b0029e3

Upload folder using huggingface_hub

Browse files
1_Pooling/config.json CHANGED
@@ -1,7 +1,7 @@
1
  {
2
  "word_embedding_dimension": 1024,
3
- "pooling_mode_cls_token": true,
4
- "pooling_mode_mean_tokens": false,
5
  "pooling_mode_max_tokens": false,
6
  "pooling_mode_mean_sqrt_len_tokens": false,
7
  "pooling_mode_weightedmean_tokens": false,
 
1
  {
2
  "word_embedding_dimension": 1024,
3
+ "pooling_mode_cls_token": false,
4
+ "pooling_mode_mean_tokens": true,
5
  "pooling_mode_max_tokens": false,
6
  "pooling_mode_mean_sqrt_len_tokens": false,
7
  "pooling_mode_weightedmean_tokens": false,
2_Dense/config.json ADDED
@@ -0,0 +1 @@
 
 
1
+ {"in_features": 1024, "out_features": 1024, "bias": true, "activation_function": "torch.nn.modules.linear.Identity"}
2_Dense/model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:11e5ec33e45c62a8b41ad5f64553bac70eb5992264dbd71441b89c5aa5a9eb53
3
+ size 4198560
3_Dropout/config.json ADDED
@@ -0,0 +1 @@
 
 
1
+ {"dropout": 0.1}
4_Dense/config.json ADDED
@@ -0,0 +1 @@
 
 
1
+ {"in_features": 1024, "out_features": 1024, "bias": true, "activation_function": "torch.nn.modules.activation.Tanh"}
4_Dense/model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:783ec5c077e67a3272687bb13167ee6ba6b94e4d1191ad15d554fc80e7bdf12b
3
+ size 4198560
README.md CHANGED
@@ -1,22 +1,438 @@
1
  ---
 
2
  library_name: sentence-transformers
 
 
 
 
 
 
3
  pipeline_tag: sentence-similarity
4
  tags:
5
  - sentence-transformers
6
  - sentence-similarity
7
  - feature-extraction
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
8
  ---
9
 
10
- # SentenceTransformer
11
 
12
- This is a [sentence-transformers](https://www.SBERT.net) model trained. It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
13
 
14
  ## Model Details
15
 
16
  ### Model Description
17
  - **Model Type:** Sentence Transformer
18
- <!-- - **Base model:** [Unknown](https://huggingface.co/unknown) -->
19
- - **Maximum Sequence Length:** 8192 tokens
20
  - **Output Dimensionality:** 1024 tokens
21
  - **Similarity Function:** Cosine Similarity
22
  <!-- - **Training Dataset:** Unknown -->
@@ -33,9 +449,14 @@ This is a [sentence-transformers](https://www.SBERT.net) model trained. It maps
33
 
34
  ```
35
  SentenceTransformer(
36
- (0): Transformer({'max_seq_length': 8192, 'do_lower_case': False}) with Transformer model: XLMRobertaModel
37
- (1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': True, 'pooling_mode_mean_tokens': False, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
38
- (2): Normalize()
 
 
 
 
 
39
  )
40
  ```
41
 
@@ -57,9 +478,9 @@ from sentence_transformers import SentenceTransformer
57
  model = SentenceTransformer("sentence_transformers_model_id")
58
  # Run inference
59
  sentences = [
60
- 'The weather is lovely today.',
61
- "It's so sunny outside!",
62
- 'He drove to the stadium.',
63
  ]
64
  embeddings = model.encode(sentences)
65
  print(embeddings.shape)
@@ -95,6 +516,22 @@ You can finetune this model on your own dataset.
95
  *List how the model may foreseeably be misused and address what users ought not to do with the model.*
96
  -->
97
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
98
  <!--
99
  ## Bias, Risks and Limitations
100
 
@@ -109,19 +546,339 @@ You can finetune this model on your own dataset.
109
 
110
  ## Training Details
111
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
112
  ### Framework Versions
113
- - Python: 3.10.14
114
- - Sentence Transformers: 3.2.1
115
- - Transformers: 4.45.1
116
- - PyTorch: 2.4.0
117
- - Accelerate: 0.34.2
118
- - Datasets: 3.0.1
119
- - Tokenizers: 0.20.0
120
 
121
  ## Citation
122
 
123
  ### BibTeX
124
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
125
  <!--
126
  ## Glossary
127
 
 
1
  ---
2
+ base_model: intfloat/multilingual-e5-large-instruct
3
  library_name: sentence-transformers
4
+ metrics:
5
+ - cosine_accuracy
6
+ - dot_accuracy
7
+ - manhattan_accuracy
8
+ - euclidean_accuracy
9
+ - max_accuracy
10
  pipeline_tag: sentence-similarity
11
  tags:
12
  - sentence-transformers
13
  - sentence-similarity
14
  - feature-extraction
15
+ - generated_from_trainer
16
+ - dataset_size:114456
17
+ - loss:MultipleNegativesRankingLoss
18
+ widget:
19
+ - source_sentence: Đối tượng hưởng chính sách ưu đãi đối với công nghiệp hỗ trợ được
20
+ quy định như thế nào?
21
+ sentences:
22
+ - 1. Hoạt động thương mại là hoạt động nhằm mục đích sinh lợi, bao gồm mua bán hàng
23
+ hoá, cung ứng dịch vụ, đầu tư, xúc tiến thương mại và các hoạt động nhằm mục đích
24
+ sinh lợi khác.
25
+ - '"Điều 11. Đối tượng và thủ tục xác nhận ưu đãi
26
+
27
+ 1. Đối tượng ưu đãi:
28
+
29
+ Dự án sản xuất sản phẩm công nghiệp hỗ trợ thuộc Danh mục sản phẩm công nghiệp
30
+ hỗ trợ ưu tiên phát triển: Bao gồm dự án đầu tư mới, dự án mở rộng và đổi mới
31
+ công nghệ có ứng dụng thiết bị mới, quy trình sản xuất mới, sản xuất sản phẩm
32
+ với năng lực sản xuất tăng ít nhất 20%."'
33
+ - Nghị định này áp dụng đối với tổ chức, cá nhân sử dụng năng lượng tại Việt Nam.
34
+ - source_sentence: Quy định bãi bỏ các cụm từ liên quan đến sổ hộ khẩu trong hồ sơ
35
+ cấp giấy xác nhận thân nhân người có công ra sao?
36
+ sentences:
37
+ - 'Điều 5. In, sử dụng mẫu sổ quốc tịch, mẫu giấy tờ về quốc tịch
38
+
39
+ 1. Mẫu sổ quốc tịch, mẫu giấy tờ về quốc tịch ban hành theo Danh mục tại Điều
40
+ 3 và Điều 4 của Thông tư này được đăng tải trên Cổng thông tin điện tử của Bộ
41
+ Tư pháp (tại địa chỉ: www.moj.gov.vn), cơ quan có thẩm quyền thụ lý hồ sơ giải
42
+ quyết các việc về quốc tịch được truy cập, tự in để sử dụng.
43
+
44
+ 2. Người có yêu cầu giải quyết các việc về quốc tịch (sau đây gọi chung là người
45
+ có yêu cầu) truy cập trên Cổng thông tin điện tử của Bộ Tư pháp để in và sử dụng
46
+ các mẫu Đơn, Bản khai lý lịch, Tờ khai. Trường hợp người có yêu cầu không thể
47
+ tự in thì cơ quan có thẩm quyền thụ lý hồ sơ có trách nhiệm in và phát miễn phí
48
+ cho người có yêu cầu.'
49
+ - 'Bãi bỏ, thay thế một số cụm từ quy định tại các nghị định
50
+
51
+ ...
52
+
53
+ 4. Bãi bỏ cụm từ “hoặc sổ hộ khẩu đã được cấp trước ngày 01 tháng 7 năm 2021”
54
+ tại điểm b khoản 1 Điều 116 và cụm từ “hoặc sổ hộ khẩu đã được cấp trước ngày
55
+ 01 tháng 7 năm 2021” tại khoản 3 Điều 130 Nghị định số 131/2021/NĐ-CP ngày 30
56
+ tháng 12 năm 2021 hướng dẫn Pháp lệnh Ưu đãi người có công với cách mạng.'
57
+ - 'Phương pháp tiến hành
58
+
59
+ 5.1 Yêu cầu chung
60
+
61
+ 5.1.1 Mẫu hậu kiểm phải được mã hóa và được gieo trồng cùng với mẫu chuẩn của
62
+ giống đó.
63
+
64
+ 5.1.2 Chăm sóc và bón phân theo quy định về khảo nghiệm giá trị canh tác và giá
65
+ trị sử dụng (khảo nghiệm VCU) của loài cây trồng tương ứng.
66
+
67
+ 5.1.3 Không loại bỏ cây khác dạng khỏi ô thí nghiệm.
68
+
69
+ 5.1.4 Các chỉ tiêu định tính: đánh giá bằng mắt, quan sát trên toàn ô thí nghiệm,
70
+ trên từng cây hoặc từng bộ phận của cây.
71
+
72
+ 5.1.5 Các chỉ tiêu định lượng: tiến hành lấy mẫu và đánh giá theo quy định về
73
+ khảo nghiệm VCU của loài cây trồng tương ứng.
74
+
75
+ ...'
76
+ - source_sentence: Chủ tịch Ủy ban nhân dân cấp xã hay cấp huyện có thẩm quyền xử
77
+ phạt hành vi uy hiếp tinh thần người tham gia hoạt động giáo dục về chăm sóc sức
78
+ khỏe và sử dụng các dịch vụ y tế vì định kiến giới?
79
+ sentences:
80
+ - 'Thuế suất 0%
81
+
82
+ 1. Thuế suất 0%: áp dụng đối với hàng hóa, dịch vụ xuất khẩu; hoạt động xây dựng,
83
+ lắp đặt công trình ở nước ngoài và ở trong khu phi thuế quan; vận tải quốc tế;
84
+ hàng hóa, dịch vụ thuộc diện không chịu thuế GTGT khi xuất khẩu, trừ các trường
85
+ hợp không áp dụng mức thuế suất 0% hướng dẫn tại khoản 3 Điều này.
86
+
87
+ Hàng hóa, dịch vụ xuất khẩu là hàng hóa, dịch vụ được bán, cung ứng cho tổ chức,
88
+ cá nhân ở nước ngoài và tiêu dùng ở ngoài Việt Nam; bán, cung ứng cho tổ chức,
89
+ cá nhân trong khu phi thuế quan; hàng hóa, dịch vụ cung cấp cho khách h��ng nước
90
+ ngoài theo quy định của pháp luật.
91
+
92
+ a) Hàng hóa xuất khẩu bao gồm:
93
+
94
+ - Hàng hóa xuất khẩu ra nước ngoài, kể cả ủy thác xuất khẩu;
95
+
96
+ - Hàng hóa bán vào khu phi thuế quan theo quy định của Thủ tướng Chính phủ; hàng
97
+ bán cho cửa hàng miễn thuế;
98
+
99
+ - Hàng hóa bán mà điểm giao, nhận hàng hóa ở ngoài Việt Nam;
100
+
101
+ - Phụ tùng, vật tư thay thế để sửa chữa, bảo dưỡng phương tiện, máy móc thiết
102
+ bị cho bên nước ngoài và tiêu dùng ở ngoài Việt Nam;
103
+
104
+ - Các trường hợp được coi là xuất khẩu theo quy định của pháp luật:
105
+
106
+ + Hàng hóa gia công chuyển tiếp theo quy định của pháp luật thương mại về hoạt
107
+ động mua, bán hàng hóa quốc tế và các hoạt động đại lý mua, bán, gia công hàng
108
+ hóa với nước ngoài.
109
+
110
+ + Hàng hóa xuất khẩu tại chỗ theo quy định của pháp luật.
111
+
112
+ + Hàng hóa xuất khẩu để bán tại hội chợ, triển lãm ở nước ngoài.
113
+
114
+ b) Dịch vụ xuất khẩu bao gồm dịch vụ cung ứng trực tiếp cho tổ chức, cá nhân ở
115
+ nước ngoài và tiêu dùng ở ngoài Việt Nam; cung ứng trực tiếp cho tổ chức, cá nhân
116
+ ở trong khu phi thuế quan và tiêu dùng trong khu phi thuế quan.
117
+
118
+ Cá nhân ở nước ngoài là người nước ngoài không cư trú tại Việt Nam, người Việt
119
+ Nam định cư ở nước ngoài và ở ngoài Việt Nam trong thời gian diễn ra việc cung
120
+ ứng dịch vụ. Tổ chức, cá nhân trong khu phi thuế quan là tổ chức, cá nhân có đăng
121
+ ký kinh doanh và các trường hợp khác theo quy định của Thủ tướng Chính phủ.
122
+
123
+ Trường hợp cung cấp dịch vụ mà hoạt động cung cấp vừa diễn ra tại Việt Nam, vừa
124
+ diễn ra ở ngoài Việt Nam nhưng hợp đồng dịch vụ được ký kết giữa hai người nộp
125
+ thuế tại Việt Nam hoặc có cơ sở thường trú tại Việt Nam thì thuế suất 0% chỉ áp
126
+ dụng đối với phần giá trị dịch vụ thực hiện ở ngoài Việt Nam, trừ trường hợp cung
127
+ cấp dịch vụ bảo hiểm cho hàng hóa nhập khẩu được áp dụng thuế suất 0% trên toàn
128
+ bộ giá trị hợp đồng. Trường hợp, hợp đồng không xác định riêng phần giá trị dịch
129
+ vụ thực hiện tại Việt Nam thì giá tính thuế được xác định theo tỷ lệ (%) chi phí
130
+ phát sinh tại Việt Nam trên tổng chi phí.
131
+
132
+ Cơ sở kinh doanh cung cấp dịch vụ là người nộp thuế tại Việt Nam phải có tài liệu
133
+ chứng minh dịch vụ thực hiện ở ngoài Việt Nam.
134
+
135
+ ...'
136
+ - '1. Thanh tra viên, người được giao thực hiện nhiệm vụ thanh tra chuyên ngành
137
+ chăn nuôi, thú y đang thi hành công vụ có quyền:
138
+
139
+ a) Phạt tiền đến 500.000 đồng đối với lĩnh vực giống vật nuôi, thức ăn chăn nuôi
140
+ và điều kiện chăn nuôi;
141
+
142
+ b) Tịch thu tang vật vi phạm hành chính có giá trị không vượt quá mức xử phạt
143
+ tiền được quy định tại điểm a khoản này.
144
+
145
+ 2. Thanh tra viên, người được giao thực hiện nhiệm vụ thanh tra chuyên ngành quản
146
+ lý chất lượng nông lâm sản và thủy sản đang thi hành công vụ có quyền:
147
+
148
+ a) Phạt tiền đến 500.000 đồng đối với lĩnh vực điều kiện chăn nuôi;
149
+
150
+ b) Tịch thu tang vật vi phạm hành chính có giá trị không vượt quá mức xử phạt
151
+ tiền được quy định tại điểm a khoản này.
152
+
153
+ 3. Thanh tra viên, người được giao thực hiện nhiệm vụ thanh tra chuyên ngành bảo
154
+ vệ thực vật đang thi hành công vụ có quyền:
155
+
156
+ a) Phạt tiền đến 500.000 đồng đối với lĩnh vực thức ăn chăn nuôi;
157
+
158
+ b) Tịch thu tang vật vi phạm hành chính có giá trị không vượt quá mức xử phạt
159
+ tiền được quy định tại điểm a khoản này.
160
+
161
+ 4. Chánh Thanh tra Sở Nông nghiệp và Phát triển nông thôn, Chi cục trưởng Chi
162
+ cục có chức năng quản lý chuyên ngành về chăn nuôi, thú y; Trưởng đoàn thanh tra
163
+ chuyên ngành Cục Chăn nuôi; Trưởng đoàn thanh tra chuyên ngành Sở Nông nghiệp
164
+ và Phát triển nông thôn; Trưởng đoàn thanh tra chuyên ngành Chi cục có chức năng
165
+ quản lý chuyên ngành về chăn nuôi, thú y có quyền:
166
+
167
+ a) Phạt tiền đến 25.000.000 đồng đối với lĩnh vực giống vật nuôi; 50.000.000 đồng
168
+ đối với lĩnh vực thức ăn chăn nuôi và điều kiện chăn nuôi;
169
+
170
+ b) Đình chỉ hoạt động có thời hạn hoặc tước quyền sử dụng có thời hạn Chứng chỉ
171
+ đào tạo về thụ tinh nhân tạo, kỹ thuật cấy truyền phôi giống vật nuôi do cơ quan,
172
+ tổ chức có thẩm quyền cấp;
173
+
174
+ c) Tịch thu tang vật vi phạm hành chính có giá trị không vượt quá mức xử phạt
175
+ tiền được quy định tại điểm a khoản này;
176
+
177
+ d) Áp dụng biện pháp khắc phục hậu quả quy định tại các điểm a, b, c, d, đ, e,
178
+ g, h, k, l, m, n, o, p, q và r khoản 3 Điều 4 của Nghị định này.
179
+
180
+ 5. Chi cục trưởng Chi cục có chức năng quản lý chuyên ngành về bảo vệ thực vật;
181
+ Trưởng đoàn thanh tra chuyên ngành Cục Bảo vệ thực vật có quyền:
182
+
183
+ a) Phạt tiền đến 50.000.000 đồng đối với lĩnh vực thức ăn chăn nuôi;
184
+
185
+ b) Tịch thu tang vật vi phạm hành chính có giá trị không vượt quá mức xử phạt
186
+ tiền được quy định tại điểm a khoản này;
187
+
188
+ c) Áp dụng biện pháp khắc phục hậu quả quy định tại các điểm a, b, c, d, đ, g,
189
+ h, k và m khoản 3 Điều 4 của Nghị định này.
190
+
191
+ 6. Chi cục trưởng Chi cục có chức năng quản lý chuyên ngành về quản lý chất lượng
192
+ nông lâm sản và thủy sản; Trưởng đoàn thanh tra chuyên ngành Cục Quản lý chất
193
+ lượng nông lâm sản và thủy sản có quyền:
194
+
195
+ a) Phạt tiền đến 50.000.000 đồng đối với lĩnh vực điều kiện chăn nuôi;
196
+
197
+ b) Tịch thu tang vật vi phạm hành chính có giá trị không vượt quá mức xử phạt
198
+ tiền được quy định tại điểm a khoản này;
199
+
200
+ c) Áp dụng biện pháp khắc phục hậu quả quy định tại các điểm c, d, đ, l và q khoản
201
+ 3 Điều 4 của Nghị định này.
202
+
203
+ 7. Trưởng đoàn thanh tra chuyên ngành Cục Thú y có quyền:
204
+
205
+ a) Phạt tiền đến 50.000.000 đồng đối với lĩnh vực thức ăn chăn nuôi và điều kiện
206
+ chăn nuôi;
207
+
208
+ b) Đình chỉ hoạt động có thời hạn;
209
+
210
+ c) Tịch thu tang vật vi phạm hành chính có giá trị không vượt quá mức xử phạt
211
+ tiền được quy định tại điểm a khoản này;
212
+
213
+ d) Áp dụng biện pháp khắc phục hậu quả quy định tại các điểm a, b, c, d, đ, g,
214
+ h, k, l, m và q khoản 3 Điều 4 của Nghị định này.
215
+
216
+ 8. Trưởng đoàn thanh tra chuyên ngành về chăn nuôi Bộ Nông nghiệp và Phát triển
217
+ nông thôn có quyền:
218
+
219
+ a) Phạt tiền đến 35.000.000 đồng đối với lĩnh vực giống vật nuôi; 70.000.000 đồng
220
+ đối với lĩnh vực thức ăn chăn nuôi và điều kiện chăn nuôi;
221
+
222
+ b) Đình chỉ hoạt động có thời hạn hoặc tước quyền sử dụng có thời hạn Chứng chỉ
223
+ đào tạo về thụ tinh nhân tạo, kỹ thuật cấy truyền phôi giống vật nuôi do cơ quan,
224
+ tổ chức có thẩm quyền cấp;
225
+
226
+ c) Tịch thu tang vật vi phạm hành chính có giá trị không vượt quá mức xử phạt
227
+ tiền được quy định tại điểm a khoản này;
228
+
229
+ d) Áp dụng biện pháp khắc phục hậu quả quy định tại khoản 3 Điều 4 của Nghị định
230
+ này.
231
+
232
+ 9. Chánh Thanh tra Bộ Nông nghiệp và Phát triển nông thôn, Cục trưởng Cục Chăn
233
+ nuôi có quyền:
234
+
235
+ a) Phạt tiền đến 50.000.000 đồng đối với lĩnh vực giống vật nuôi; 100.000.000
236
+ đồng đối với lĩnh vực thức ăn chăn nuôi và điều kiện chăn nuôi;
237
+
238
+ b) Đình chỉ hoạt động có thời hạn hoặc tước quyền sử dụng có thời hạn Chứng chỉ
239
+ đào tạo về thụ tinh nhân tạo, kỹ thuật cấy truyền phôi giống vật nuôi do cơ quan,
240
+ tổ chức có thẩm quyền cấp;
241
+
242
+ c) Tịch thu tang vật vi phạm hành chính;
243
+
244
+ d) Áp dụng biện pháp khắc phục hậu quả quy định tại khoản 3 Điều 4 của Nghị định
245
+ này.
246
+
247
+ 10. Cục trưởng Cục Thú y có quyền:
248
+
249
+ a) Phạt tiền đến 100.000.000 đồng đối với lĩnh vực thức ăn chăn nuôi và điều kiện
250
+ chăn nuôi;
251
+
252
+ b) Tịch thu tang vật vi phạm hành chính;
253
+
254
+ c) Áp dụng biện pháp khắc phục hậu quả quy định tại các điểm a, b, c, d, đ, g,
255
+ h, k, l, m và q khoản 3 Điều 4 của Nghị định này.
256
+
257
+ 11. Cục trưởng Cục Bảo vệ thực vật có quyền:
258
+
259
+ a) Phạt tiền đến 100.000.000 đồng đối với lĩnh vực thức ăn chăn nuôi;
260
+
261
+ b) Tịch thu tang vật vi phạm hành chính;
262
+
263
+ c) Áp dụng biện pháp khắc phục hậu quả quy định tại các điểm a, b, c, d, đ, g,
264
+ h, k và m khoản 3 Điều 4 của Nghị định này.
265
+
266
+ 12. Cục trưởng Cục Quản lý chất l��ợng nông lâm sản và thủy sản có quyền:
267
+
268
+ a) Phạt tiền đến 100.000.000 đồng đối với lĩnh vực điều kiện chăn nuôi;
269
+
270
+ b) Tịch thu tang vật vi phạm hành chính;
271
+
272
+ c) Áp dụng biện pháp khắc phục hậu quả quy định tại các điểm c, d, đ, l và q khoản
273
+ 3 Điều 4 của Nghị định này.'
274
+ - Người có thẩm quyền xử phạt thuộc Công an nhân dân có thẩm quyền xử phạt vi phạm
275
+ hành chính đối với hành vi quy định tại Điều 6 Nghị định này.
276
+ - source_sentence: Kết hôn được hiểu như thế nào? Điều kiện để được đăng ký kết hôn
277
+ được quy định ra sao?
278
+ sentences:
279
+ - Các quy định của Bộ luật dân sự và các luật khác có liên quan đến quan hệ hôn
280
+ nhân và gia đình được áp dụng đối với quan hệ hôn nhân và gia đình trong trường
281
+ hợp Luật này không quy định.
282
+ - '"Điều 4. Ngày thi, lịch thi, nội dung thi, hình thức thi và thời gian làm bài
283
+ thi/môn thi
284
+
285
+ 1. Ngày thi, lịch thi: Được quy định trong hướng dẫn tổ chức kỳ thi tốt nghiệp
286
+ THPT hằng năm của Bộ GDĐT.
287
+
288
+ 2. Nội dung thi: Nội dung thi nằm trong chương trình THPT, chủ yếu là chương trình
289
+ lớp 12.
290
+
291
+ 3. Hình thức thi: Các bài thi Toán, Ngoại ngữ, KHTN và KHXH thi theo hình thức
292
+ trắc nghiệm khách quan (gọi chung là bài thi trắc nghiệm); bài thi Ngữ văn thi
293
+ theo hình thức tự luận (gọi chung là bài thi tự luận).
294
+
295
+ 4. Thời gian làm bài thi/môn thi: Ngữ văn 120 phút; Toán 90 phút; Ngoại ngữ 60
296
+ phút; 50 phút đối với mỗi môn thi thành phần của bài thi tổ hợp KHTN và KHXH."'
297
+ - '"Điều 8. Điều kiện kết hôn
298
+
299
+ 1. Nam, nữ kết hôn với nhau phải tuân theo các điều kiện sau đây:
300
+
301
+ a) Nam từ đủ 20 tuổi trở lên, nữ từ đủ 18 tuổi trở lên;
302
+
303
+ b) Việc kết hôn do nam và nữ tự nguyện quyết định;
304
+
305
+ c) Không bị mất năng lực hành vi dân sự;
306
+
307
+ d) Việc kết hôn không thuộc một trong các trường hợp cấm kết hôn theo quy định
308
+ tại các điểm a, b, c và d khoản 2 Điều 5 của Luật này.
309
+
310
+ 2. Nhà nước không thừa nhận hôn nhân giữa những người cùng giới tính.
311
+
312
+ Điều 9. Đăng ký kết hôn
313
+
314
+ 1. Việc kết hôn phải được đăng ký và do cơ quan nhà nước có thẩm quyền thực hiện
315
+ theo quy định của Luật này và pháp luật về hộ tịch.
316
+
317
+ Việc kết hôn không được đăng ký theo quy định tại khoản này thì không có giá trị
318
+ pháp lý.
319
+
320
+ 2. Vợ chồng đã ly hôn muốn xác lập lại quan hệ vợ chồng thì phải đăng ký kết hôn."'
321
+ - source_sentence: Thời điểm xem xét bổ nhiệm lại công chức lãnh đạo cấp Vụ theo quy
322
+ định là bao lâu?
323
+ sentences:
324
+ - "Thời điểm xem xét bổ nhiệm lại, thời hạn giữ chức vụ\n1. Thời điểm xem xét bổ\
325
+ \ nhiệm lại \na) Chậm nhất là 90 ngày trước ngày hết thời hạn bổ nhiệm công chức,\
326
+ \ viên chức cấp vụ và cấp phòng, đơn vị thuộc Bộ phải tiến hành quy trình bổ nhiệm\
327
+ \ lại để quyết định hoặc trình cấp có thẩm quyền xem xét, quyết định bổ nhiệm\
328
+ \ lại hoặc không bổ nhiệm lại công chức lãnh đạo, quản lý;\nb) Quyết định bổ nhiệm\
329
+ \ lại công chức giữ chức vụ lãnh đạo, quản lý phải được ban hành trước ít nhất\
330
+ \ 01 ngày làm việc, tính đến ngày hết thời hạn bổ nhiệm.\n..."
331
+ - 'Mức phụ cấp ưu đãi
332
+
333
+ 1. Mức phụ cấp 70% áp dụng đối với công chức, viên chức thường xuyên, trực tiếp
334
+ làm các công việc sau đây:
335
+
336
+ a) Xét nghiệm, khám, điều trị, chăm sóc người bệnh HIV/AIDS, phong, lao, tâm thần;
337
+
338
+ b) Giám định pháp y, pháp y tâm thần, giải phẫu bệnh lý.
339
+
340
+ 2. Mức phụ cấp 60% áp dụng đối với công chức, viên chức thường xuyên, trực tiếp
341
+ làm các công việc sau đây:
342
+
343
+ a) Khám, điều trị, chăm sóc người bệnh cấp cứu, hồi sức cấp cứu, cấp cứu 115,
344
+ truyền nhiễm;
345
+
346
+ b) Xét nghiệm, phòng chống bệnh truyền nhiễm;
347
+
348
+ c) Kiểm dịch y tế biên giới.
349
+
350
+ 3. Mức phụ cấp 50% áp dụng đối với công chức, viên chức thường xuyên, trực tiếp
351
+ khám, điều trị, chăm sóc, phục vụ người bệnh gây mê hồi sức, điều trị tích cực,
352
+ nhi, chống độc, bỏng và da liễu.
353
+
354
+ 4. Mức phụ cấp 40% áp dụng đối với công chức, viên chức thường xuyên, trực tiếp
355
+ làm chuyên môn y tế dự phòng; xét nghiệm; khám bệnh, chữa bệnh; kiểm soát nhiễm
356
+ khuẩn, chăm sóc người bệnh, phục hồi chức năng; giám định y khoa; y dược cổ truyền;
357
+ dược, mỹ phẩm; an toàn vệ sinh thực phẩm, trang thiết bị y tế; sức khỏe sinh sản
358
+ tại các cơ sở sự nghiệp y tế công lập và tại các cơ sở điều dưỡng thương binh,
359
+ bệnh binh, người khuyết tật đặc biệt, trừ các trường hợp quy định tại khoản 1,
360
+ 2 và 3 Điều này.
361
+
362
+ 5. Mức phụ cấp 30% áp dụng đối với công chức, viên chức sau đây:
363
+
364
+ a) Công chức, viên chức thường xuyên, trực tiếp làm chuyên môn y tế để thực hiện
365
+ các công việc: truyền thông giáo dục sức khỏe; dân số - kế hoạch hóa gia đình;
366
+
367
+ b) Công chức, viên chức quản lý, phục vụ không trực tiếp làm chuyên môn y tế tại
368
+ các cơ sở, viện, bệnh viện chuyên khoa, các trung tâm: HIV/AIDS, phong, lao, tâm
369
+ thần, giải phẫu bệnh lý, pháp y.
370
+
371
+ 6. Đối với công chức, viên chức không trực tiếp làm chuyên môn y tế; công chức,
372
+ viên chức y tế làm công tác quản lý, phục vụ tại các đơn vị sự nghiệp y tế nói
373
+ chung (trừ đối tượng quy định tại điểm b khoản 5 Điều này), viên chức làm công
374
+ tác chuyên môn y tế tại cơ quan, đơn vị, trường học thì thủ trưởng đơn vị căn
375
+ cứ vào đặc thù công việc và nguồn thu để xem xét, quyết định nhưng không vượt
376
+ quá mức 20% so với mức lương ngạch, bậc hiện hưởng cộng phụ cấp chức vụ lãnh đạo,
377
+ phụ cấp thâm niên vượt khung (nếu có) của đối tượng được hưởng.7. Mức phụ cấp
378
+ ưu đãi theo nghề đối với viên chức y tế dự phòng, y tế cơ sở áp dụng từ ngày 01
379
+ tháng 01 năm 2022 đến hết ngày 31 tháng 12 năm 2023:
380
+
381
+ 7. Mức phụ cấp ưu đãi theo nghề đối với viên chức y tế dự phòng, y tế cơ sở áp
382
+ dụng từ ngày 01 tháng 01 năm 2022 đến hết ngày 31 tháng 12 năm 2023:
383
+
384
+ a) Mức phụ cấp 100% áp dụng đối với viên chức thường xuyên, trực tiếp làm chuyên
385
+ môn y tế dự phòng (bao gồm cả kiểm dịch y tế biên giới); làm chuyên môn y tế tại
386
+ Trạm y tế xã, phường, thị trấn, Phòng khám đa khoa khu vực, Nhà hộ sinh, Trung
387
+ tâm y tế huyện, quận, thị xã, thành phố thuộc tỉnh, thành phố thuộc thành phố
388
+ trực thuộc trung ương và bệnh viện tuyến huyện, quận, thị xã, thành phố thuộc
389
+ tỉnh, thành phố thuộc thành phố trực thuộc trung ương.
390
+
391
+ b) Trong thời gian áp dụng mức phụ cấp ưu đãi theo nghề đối với viên chức y tế
392
+ dự phòng, y tế cơ sở quy định tại khoản 7 này thì không áp dụng quy định tại điểm
393
+ c khoản 2 và quy định đối với viên chức thường xuyên, trực tiếp làm chuyên môn
394
+ y tế dự phòng tại khoản 4 Điều 3.'
395
+ - Khoản 5. Cấp có thẩm quyền bổ nhiệm quyết định tiêu chuẩn, điều kiện về thành
396
+ tích, kết quả và sản phẩm cụ thể phù hợp để thực hiện việc bổ nhiệm trong thời
397
+ gian chưa có văn bản hướng dẫn nội dung quy định tại điểm b khoản 2 Điều 33 Nghị
398
+ định này.
399
+ model-index:
400
+ - name: SentenceTransformer based on intfloat/multilingual-e5-large-instruct
401
+ results:
402
+ - task:
403
+ type: triplet
404
+ name: Triplet
405
+ dataset:
406
+ name: Unknown
407
+ type: unknown
408
+ metrics:
409
+ - type: cosine_accuracy
410
+ value: 0.9885119464969527
411
+ name: Cosine Accuracy
412
+ - type: dot_accuracy
413
+ value: 0.009654279704438811
414
+ name: Dot Accuracy
415
+ - type: manhattan_accuracy
416
+ value: 0.9884040774499757
417
+ name: Manhattan Accuracy
418
+ - type: euclidean_accuracy
419
+ value: 0.9885119464969527
420
+ name: Euclidean Accuracy
421
+ - type: max_accuracy
422
+ value: 0.9885119464969527
423
+ name: Max Accuracy
424
  ---
425
 
426
+ # SentenceTransformer based on intfloat/multilingual-e5-large-instruct
427
 
428
+ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [intfloat/multilingual-e5-large-instruct](https://huggingface.co/intfloat/multilingual-e5-large-instruct). It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
429
 
430
  ## Model Details
431
 
432
  ### Model Description
433
  - **Model Type:** Sentence Transformer
434
+ - **Base model:** [intfloat/multilingual-e5-large-instruct](https://huggingface.co/intfloat/multilingual-e5-large-instruct) <!-- at revision c9e87c786ffac96aeaeb42863276930883923ecb -->
435
+ - **Maximum Sequence Length:** 512 tokens
436
  - **Output Dimensionality:** 1024 tokens
437
  - **Similarity Function:** Cosine Similarity
438
  <!-- - **Training Dataset:** Unknown -->
 
449
 
450
  ```
451
  SentenceTransformer(
452
+ (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: XLMRobertaModel
453
+ (1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
454
+ (2): Dense({'in_features': 1024, 'out_features': 1024, 'bias': True, 'activation_function': 'torch.nn.modules.linear.Identity'})
455
+ (3): Dropout(
456
+ (dropout_layer): Dropout(p=0.1, inplace=False)
457
+ )
458
+ (4): Dense({'in_features': 1024, 'out_features': 1024, 'bias': True, 'activation_function': 'torch.nn.modules.activation.Tanh'})
459
+ (5): Normalize()
460
  )
461
  ```
462
 
 
478
  model = SentenceTransformer("sentence_transformers_model_id")
479
  # Run inference
480
  sentences = [
481
+ 'Thời điểm xem xét bổ nhiệm lại công chức lãnh đạo cấp Vụ theo quy định là bao lâu?',
482
+ 'Thời điểm xem xét bổ nhiệm lại, thời hạn giữ chức vụ\n1. Thời điểm xem xét bổ nhiệm lại \na) Chậm nhất là 90 ngày trước ngày hết thời hạn bổ nhiệm công chức, viên chức cấp vụ và cấp phòng, đơn vị thuộc Bộ phải tiến hành quy trình bổ nhiệm lại để quyết định hoặc trình cấp có thẩm quyền xem xét, quyết định bổ nhiệm lại hoặc không bổ nhiệm lại công chức lãnh đạo, quản lý;\nb) Quyết định bổ nhiệm lại công chức giữ chức vụ lãnh đạo, quản lý phải được ban hành trước ít nhất 01 ngày làm việc, tính đến ngày hết thời hạn bổ nhiệm.\n...',
483
+ 'Khoản 5. Cấp thẩm quyền bổ nhiệm quyết định tiêu chuẩn, điều kiện về thành tích, kết quả và sản phẩm cụ thể phù hợp để thực hiện việc bổ nhiệm trong thời gian chưa có văn bản hướng dẫn nội dung quy định tại điểm b khoản 2 Điều 33 Nghị định này.',
484
  ]
485
  embeddings = model.encode(sentences)
486
  print(embeddings.shape)
 
516
  *List how the model may foreseeably be misused and address what users ought not to do with the model.*
517
  -->
518
 
519
+ ## Evaluation
520
+
521
+ ### Metrics
522
+
523
+ #### Triplet
524
+
525
+ * Evaluated with [<code>TripletEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.TripletEvaluator)
526
+
527
+ | Metric | Value |
528
+ |:-------------------|:-----------|
529
+ | cosine_accuracy | 0.9885 |
530
+ | dot_accuracy | 0.0097 |
531
+ | manhattan_accuracy | 0.9884 |
532
+ | euclidean_accuracy | 0.9885 |
533
+ | **max_accuracy** | **0.9885** |
534
+
535
  <!--
536
  ## Bias, Risks and Limitations
537
 
 
546
 
547
  ## Training Details
548
 
549
+ ### Training Dataset
550
+
551
+ #### Unnamed Dataset
552
+
553
+
554
+ * Size: 114,456 training samples
555
+ * Columns: <code>anchor</code>, <code>positive</code>, and <code>negative</code>
556
+ * Approximate statistics based on the first 1000 samples:
557
+ | | anchor | positive | negative |
558
+ |:--------|:----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------|
559
+ | type | string | string | string |
560
+ | details | <ul><li>min: 7 tokens</li><li>mean: 24.33 tokens</li><li>max: 55 tokens</li></ul> | <ul><li>min: 23 tokens</li><li>mean: 263.88 tokens</li><li>max: 512 tokens</li></ul> | <ul><li>min: 7 tokens</li><li>mean: 111.33 tokens</li><li>max: 512 tokens</li></ul> |
561
+ * Samples:
562
+ | anchor | positive | negative |
563
+ |:-----------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
564
+ | <code>Người phát ngôn của Bộ Công thương được quyền phát ngôn trong trường hợp đột xuất nào?</code> | <code>Phát ngôn và cung cấp thông tin trong trường hợp đột xuất, bất thường<br>1. Người phát ngôn Bộ Công an hoặc Người được ủy quyền phát ngôn của Bộ Công an có trách nhiệm phát ngôn và cung cấp thông tin kịp thời, chính xác cho báo chí trong các trường hợp đột xuất, bất thường sau đây:<br>a) Khi Bộ Công an được Chính phủ giao chủ trì xử lý sự cố xảy ra liên quan đến nhiều bộ, ngành, tỉnh, thành phố trực thuộc trung ương;<br>b) Khi xảy ra các sự kiện, vấn đề quan trọng có tác động lớn trong xã hội hoặc khi dư luận xuất hiện nhiều ý kiến không thống nhất về một vấn đề thuộc phạm vi quản lý của Bộ Công an nhằm cảnh báo kịp thời và định hướng dư luận.<br>Trường hợp xảy ra vụ việc cần có ngay thông tin ban đầu của Bộ Công an, Người phát ngôn Bộ Công an hoặc Người được ủy quyền phát ngôn của Bộ Công an có trách nhiệm chủ động phát ngôn, cung cấp thông tin cho báo chí trong thời gian chậm nhất là 24 giờ, kể từ khi vụ việc xảy ra;<br>c) Khi cơ quan báo chí hoặc cơ quan chỉ đạo, quản lý nhà nước về báo chí có yêu cầu phát ngôn và cung cấp thông tin về các sự kiện, vấn đề thuộc phạm vi quản lý nhà nước của Bộ Công an đã được nêu trên báo chí hoặc về các sự kiện, vấn đề quy định tại điểm b khoản này;<br>d) Khi có căn cứ cho rằng báo chí đăng, phát thông tin sai sự thật liên quan đến Bộ Công an, Người phát ngôn Bộ Công an hoặc Người được ủy quyền phát ngôn của Bộ Công an có trách nhiệm yêu cầu cơ quan báo chí đó phải đăng, phát ý kiến phản hồi, cải chính theo quy định của pháp luật.<br>2. Người thực hiện phát ngôn và cung cấp thông tin cho báo chí của đơn vị thuộc Bộ, Công an cấp tỉnh có trách nhiệm phát ngôn và cung cấp thông tin kịp thời, chính xác cho báo chí trong các trường hợp đột xuất, bất thường sau đây:<br>a) Khi xảy ra các sự kiện, vấn đề quan trọng có tác động lớn trong xã hội hoặc khi dư luận xuất hiện nhiều ý kiến không thống nhất về một vấn đề thuộc phạm vi quản lý của cơ quan mình nhằm cảnh báo kịp thời và định hướng dư luận;<br>b) Khi cơ quan báo chí hoặc cơ quan chỉ đạo, quản lý nhà nước về báo chí có yêu cầu phát ngôn và cung cấp thông tin về các sự kiện, vấn đề thuộc phạm vi quản lý nhà nước của cơ quan mình đã được nêu trên báo chí hoặc về các sự kiện, vấn đề quy định tại điểm a khoản này;<br>c) Khi có căn cứ cho rằng báo chí đăng, phát thông tin sai sự thật liên quan đến đơn vị mình, người thực hiện phát ngôn và cung cấp thông tin cho báo chí của đơn vị thuộc Bộ, Công an cấp tỉnh có trách nhiệm yêu cầu cơ quan báo chí đó phải đăng, phát ý kiến phản hồi, cải chính theo quy định của pháp luật;<br>d) Trường hợp cần tổ chức họp báo để cung cấp thông tin cho báo chí thì Thủ trưởng đơn vị thuộc Bộ, Giám đốc Công an cấp tỉnh phải báo cáo, xin ý kiến Bộ trưởng hoặc Thứ trưởng phụ trách</code> | <code>Người phát ngôn được quyền từ chối trả lời những vấn đề về hoạt động của Chính phủ, Thủ tướng Chính phủ không thuộc thẩm quyền phát ngôn; được quyền cải chính những thông tin không đúng sự thật liên quan đến quan điểm và hoạt động của Chính phủ, Thủ tướng Chính phủ</code> |
565
+ | <code>Lệ phí thực hiện thủ tục công nhận doanh nghiệp ưu tiên trong lĩnh vực hải quan là bao nhiêu?</code> | <code>NỘI DỤNG CỤ THỂ CỦA TỪNG THỦ TỤC HÀNH CHÍNH THUỘC PHẠM VI CHỨC NĂNG QUẢN LÝ CỦA BỘ TÀI CHÍNH<br>1. Tên thủ tục: Thủ tục công nhận doanh nghiệp ưu tiên trong lĩnh vực hải quan<br>...<br>1.7. Kết quả thực hiện thủ tục hành chính:<br>Quyết định công nhận doanh nghiệp ưu tiên (Mẫu 03/DNUT ban hành kèm theo Thông tư 07/2019/TT-BTC ngày 28/01/2019).<br>1.8. Phí, lệ phí: không có.<br>1.9. Tên mẫu đơn, mẫu tờ khai:<br>- Doanh nghiệp xuất khẩu, nhập khẩu hàng hóa và Đại lý làm thủ tục hải quan nộp văn bản đề nghị áp dụng chế độ ưu tiên theo mẫu 02a/DNUT ban hành kèm theo Thông tư 07/2019/TT-BTC ngày 28/01/2019<br>- Tổ chức, cá nhân nhập khẩu hàng hóa để thực hiện dự án đầu tư trọng điểm được Thủ tướng Chính phủ cho ý kiến trước khi cấp phép đầu tư đang trong giai đoạn xây dựng cơ bản nộp văn bản đề nghị áp dụng chế độ ưu tiên theo mẫu 02b/DNUT ban hành kèm theo Thông tư 72/2015/TT-BTC ngày 12/5/2015.<br>...</code> | <code>Quyết định này áp dụng đối với cơ quan nhà nước, doanh nghiệp và tổ chức, cá nhân tham gia hoạt động nhập khẩu, sản xuất và kinh doanh hàng hóa quy định tại khoản 1 và khoản 2 Điều 3 Quyết định này.</code> |
566
+ | <code>Chuẩn bị phiên họp giải quyết tranh chấp</code> | <code>Điều 54. Chuẩn bị phiên họp giải quyết tranh chấp<br>1. Trường hợp các bên không có thoả thuận khác hoặc quy tắc tố tụng của Trung tâm trọng tài không có quy định khác, thời gian và địa điểm mở phiên họp do Hội đồng trọng tài quyết định.<br>2. Trường hợp các bên không có thoả thuận khác hoặc quy tắc tố tụng của Trung tâm trọng tài không có quy định khác, giấy triệu tập tham dự phiên họp phải được gửi cho các bên chậm nhất 30 ngày trước ngày mở phiên họp.</code> | <code>Điều 3. Giải thích từ ngữ<br>...<br>2. Thoả thuận trọng tài là thoả thuận giữa các bên về việc giải quyết bằng Trọng tài tranh chấp có thể phát sinh hoặc đã phát sinh.</code> |
567
+ * Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
568
+ ```json
569
+ {
570
+ "scale": 20.0,
571
+ "similarity_fct": "cos_sim"
572
+ }
573
+ ```
574
+
575
+ ### Evaluation Dataset
576
+
577
+ #### Unnamed Dataset
578
+
579
+
580
+ * Size: 18,541 evaluation samples
581
+ * Columns: <code>anchor</code>, <code>positive</code>, and <code>negative</code>
582
+ * Approximate statistics based on the first 1000 samples:
583
+ | | anchor | positive | negative |
584
+ |:--------|:----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------|
585
+ | type | string | string | string |
586
+ | details | <ul><li>min: 7 tokens</li><li>mean: 24.31 tokens</li><li>max: 51 tokens</li></ul> | <ul><li>min: 13 tokens</li><li>mean: 278.85 tokens</li><li>max: 512 tokens</li></ul> | <ul><li>min: 7 tokens</li><li>mean: 108.66 tokens</li><li>max: 512 tokens</li></ul> |
587
+ * Samples:
588
+ | anchor | positive | negative |
589
+ |:-----------------------------------------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
590
+ | <code>Địa điểm, cơ sở hạ tầng, trang thiết bị khảo nghiệm tính đồng nhất giống ngô được quy định như thế nào?</code> | <code>Yêu cầu về khảo nghiệm<br>4.1 Yêu cầu về địa điểm, cơ sở hạ tầng, trang thiết bị khảo nghiệm tính khác biệt, tính đồng nhất và tính ổn định giống lúa<br>- Tổ chức thử nghiệm giống, sản phẩm cây trồng được cơ quan có thẩm quyền cấp giấy chứng nhận đăng ký hoạt động để kiểm tra chất lượng hạt giống gửi khảo nghiệm (ngoại trừ chỉ tiêu hạt khác giống) và phân tích các chỉ tiêu chất lượng sản phẩm cây trồng theo quy định tại 5.2.1;<br>- Kho lưu mẫu giống khảo nghiệm và mẫu chuẩn: phải có thiết bị làm mát, điều chỉnh được nhiệt độ, ẩm độ. Đảm bảo nhiệt độ từ 5 °C đến 15 °C, độ ẩm tương đối từ 40 % đến 60 %. Thể tích kho tối thiểu 20 m3;<br>- Trang thiết bị phục vụ cho quá trình khảo nghiệm như: kính lúp, bảng so màu, máy tính, máy in, thiết bị ghi hình, phần mềm xử lý số liệu;<br>- Thiết bị, dụng cụ đo lường đã được kiểm định hoặc hiệu chuẩn định kỳ theo quy định, bao gồm: cân điện tử độ chính xác 0,1 g hoặc 0,01 g; cân có thể cân ít nhất 10 kg; máy đo độ ẩm hạt; dụng cụ đo nhiệt độ và độ ẩm, dụng cụ đo pH, kính hiển vi có độ phóng đại đến 400 lần;<br>- Vật dụng để thiết kế, triển khai thí nghiệm trên đồng ruộng như: thước, bình phun hoặc máy phun thuốc bảo vệ thực vật, bảng, biển hiệu phục vụ khảo nghiệm và các dụng cụ cần thiết khác;<br>- Trang bị bảo hộ lao động bao gồm: khẩu trang, quần áo bảo hộ lao động, ủng, găng tay;<br>- Đủ diện tích đất để bố trí khảo nghiệm trên đồng ruộng, tối thiểu là 140 m2;<br>- Bộ mẫu chuẩn của các giống biết đến rộng rãi.<br>...</code> | <code>Khoản 1.12. Phụ lục 12: Yêu cầu kỹ thuật và phương pháp thử đối với trinatri citrat</code> |
591
+ | <code>Hoạt động thương mại có những đặc điểm nào?</code> | <code>1. Hoạt động thương mại là hoạt động nhằm mục đích sinh lợi, bao gồm mua bán hàng hoá, cung ứng dịch vụ, đầu tư, xúc tiến thương mại và các hoạt động nhằm mục đích sinh lợi khác.</code> | <code>Điều 2. Sửa đổi, bổ sung một số điều Nghị định số 20/2006/NĐ-CP ngày 20 tháng 02 năm 2006 của Chính phủ quy định chi tiết Luật Thương mại về kinh doanh dịch vụ giám định thương mại</code> |
592
+ | <code>Cơ cấu tổ chức của Hội đồng phối hợp phổ biến giáo dục pháp luật Bộ Công an bao gồm những thành phần nào?</code> | <code>Cơ cấu tổ chức của Hội đồng, chế độ làm việc và con dấu của Hội đồng<br>...<br>2. Chế độ làm việc của Hội đồng<br>a) Hội đồng làm việc theo nguyên tắc thảo luận tập thể, phát huy vai trò của từng thành viên Hội đồng;<br>b) Các thành viên Hội đồng làm việc theo chế độ kiêm nhiệm;<br>c) Hội đồng họp định kỳ 2 lần/năm, họp đột xuất theo yêu cầu của Chủ tịch Hội đồng hoặc theo ý kiến của tối thiểu ½ Ủy viên Hội đồng.<br>3. Con dấu của Hội đồng<br>Hội đồng sử dụng con dấu của Bộ Công an. Trong trường hợp Phó Chủ tịch Thường trực Hội đồng ký thay Chủ tịch Hội đồng thì sử dụng con dấu của Cơ quan Thường trực Hội đồng.<br>4. Mối quan hệ giữa Hội đồng với các Tổng cục, Bộ Tư lệnh, đơn vị trực thuộc Bộ, Công an, Cảnh sát phòng cháy và chữa cháy tỉnh, thành phố trực thuộc Trung ương (Công an các đơn vị, địa phương)<br>a) Hội đồng phối hợp phổ biến, giáo dục pháp luật Bộ Công an hướng dẫn, kiểm tra hoạt động phối hợp phổ biến, giáo dục pháp luật của Công an các đơn vị, địa phương;<br>b) Công an các đơn vị, địa phương định kỳ sáu tháng, một năm có trách nhiệm báo cáo kết quả hoạt động phổ biến, giáo dục pháp luật của đơn vị, địa phương mình với Hội đồng phối hợp phổ biến, giáo dục pháp luật Bộ Công an (qua Cơ quan Thường trực Hội đồng).</code> | <code>Thông tư này hướng dẫn về nghiệp vụ để thực hiện chức năng, nhiệm vụ, quyền hạn của các tổ chức pháp chế.</code> |
593
+ * Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
594
+ ```json
595
+ {
596
+ "scale": 20.0,
597
+ "similarity_fct": "cos_sim"
598
+ }
599
+ ```
600
+
601
+ ### Training Hyperparameters
602
+ #### Non-Default Hyperparameters
603
+
604
+ - `eval_strategy`: steps
605
+ - `per_device_train_batch_size`: 32
606
+ - `per_device_eval_batch_size`: 32
607
+ - `warmup_ratio`: 0.1
608
+ - `bf16`: True
609
+ - `batch_sampler`: no_duplicates
610
+
611
+ #### All Hyperparameters
612
+ <details><summary>Click to expand</summary>
613
+
614
+ - `overwrite_output_dir`: False
615
+ - `do_predict`: False
616
+ - `eval_strategy`: steps
617
+ - `prediction_loss_only`: True
618
+ - `per_device_train_batch_size`: 32
619
+ - `per_device_eval_batch_size`: 32
620
+ - `per_gpu_train_batch_size`: None
621
+ - `per_gpu_eval_batch_size`: None
622
+ - `gradient_accumulation_steps`: 1
623
+ - `eval_accumulation_steps`: None
624
+ - `torch_empty_cache_steps`: None
625
+ - `learning_rate`: 5e-05
626
+ - `weight_decay`: 0.0
627
+ - `adam_beta1`: 0.9
628
+ - `adam_beta2`: 0.999
629
+ - `adam_epsilon`: 1e-08
630
+ - `max_grad_norm`: 1.0
631
+ - `num_train_epochs`: 3
632
+ - `max_steps`: -1
633
+ - `lr_scheduler_type`: linear
634
+ - `lr_scheduler_kwargs`: {}
635
+ - `warmup_ratio`: 0.1
636
+ - `warmup_steps`: 0
637
+ - `log_level`: passive
638
+ - `log_level_replica`: warning
639
+ - `log_on_each_node`: True
640
+ - `logging_nan_inf_filter`: True
641
+ - `save_safetensors`: True
642
+ - `save_on_each_node`: False
643
+ - `save_only_model`: False
644
+ - `restore_callback_states_from_checkpoint`: False
645
+ - `no_cuda`: False
646
+ - `use_cpu`: False
647
+ - `use_mps_device`: False
648
+ - `seed`: 42
649
+ - `data_seed`: None
650
+ - `jit_mode_eval`: False
651
+ - `use_ipex`: False
652
+ - `bf16`: True
653
+ - `fp16`: False
654
+ - `fp16_opt_level`: O1
655
+ - `half_precision_backend`: auto
656
+ - `bf16_full_eval`: False
657
+ - `fp16_full_eval`: False
658
+ - `tf32`: None
659
+ - `local_rank`: 0
660
+ - `ddp_backend`: None
661
+ - `tpu_num_cores`: None
662
+ - `tpu_metrics_debug`: False
663
+ - `debug`: []
664
+ - `dataloader_drop_last`: False
665
+ - `dataloader_num_workers`: 0
666
+ - `dataloader_prefetch_factor`: None
667
+ - `past_index`: -1
668
+ - `disable_tqdm`: False
669
+ - `remove_unused_columns`: True
670
+ - `label_names`: None
671
+ - `load_best_model_at_end`: False
672
+ - `ignore_data_skip`: False
673
+ - `fsdp`: []
674
+ - `fsdp_min_num_params`: 0
675
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
676
+ - `fsdp_transformer_layer_cls_to_wrap`: None
677
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
678
+ - `deepspeed`: None
679
+ - `label_smoothing_factor`: 0.0
680
+ - `optim`: adamw_torch
681
+ - `optim_args`: None
682
+ - `adafactor`: False
683
+ - `group_by_length`: False
684
+ - `length_column_name`: length
685
+ - `ddp_find_unused_parameters`: None
686
+ - `ddp_bucket_cap_mb`: None
687
+ - `ddp_broadcast_buffers`: False
688
+ - `dataloader_pin_memory`: True
689
+ - `dataloader_persistent_workers`: False
690
+ - `skip_memory_metrics`: True
691
+ - `use_legacy_prediction_loop`: False
692
+ - `push_to_hub`: False
693
+ - `resume_from_checkpoint`: None
694
+ - `hub_model_id`: None
695
+ - `hub_strategy`: every_save
696
+ - `hub_private_repo`: False
697
+ - `hub_always_push`: False
698
+ - `gradient_checkpointing`: False
699
+ - `gradient_checkpointing_kwargs`: None
700
+ - `include_inputs_for_metrics`: False
701
+ - `eval_do_concat_batches`: True
702
+ - `fp16_backend`: auto
703
+ - `push_to_hub_model_id`: None
704
+ - `push_to_hub_organization`: None
705
+ - `mp_parameters`:
706
+ - `auto_find_batch_size`: False
707
+ - `full_determinism`: False
708
+ - `torchdynamo`: None
709
+ - `ray_scope`: last
710
+ - `ddp_timeout`: 1800
711
+ - `torch_compile`: False
712
+ - `torch_compile_backend`: None
713
+ - `torch_compile_mode`: None
714
+ - `dispatch_batches`: None
715
+ - `split_batches`: None
716
+ - `include_tokens_per_second`: False
717
+ - `include_num_input_tokens_seen`: False
718
+ - `neftune_noise_alpha`: None
719
+ - `optim_target_modules`: None
720
+ - `batch_eval_metrics`: False
721
+ - `eval_on_start`: False
722
+ - `use_liger_kernel`: False
723
+ - `eval_use_gather_object`: False
724
+ - `batch_sampler`: no_duplicates
725
+ - `multi_dataset_batch_sampler`: proportional
726
+
727
+ </details>
728
+
729
+ ### Training Logs
730
+ <details><summary>Click to expand</summary>
731
+
732
+ | Epoch | Step | Training Loss | Validation Loss | max_accuracy |
733
+ |:------:|:-----:|:-------------:|:---------------:|:------------:|
734
+ | 0.0280 | 100 | 2.4949 | - | - |
735
+ | 0.0559 | 200 | 0.6501 | - | - |
736
+ | 0.0839 | 300 | 0.3105 | - | - |
737
+ | 0.1118 | 400 | 0.2505 | - | - |
738
+ | 0.1398 | 500 | 0.2088 | - | - |
739
+ | 0.1677 | 600 | 0.1804 | - | - |
740
+ | 0.1957 | 700 | 0.1977 | - | - |
741
+ | 0.2237 | 800 | 0.1602 | - | - |
742
+ | 0.2516 | 900 | 0.1663 | - | - |
743
+ | 0.2796 | 1000 | 0.1513 | - | - |
744
+ | 0.3075 | 1100 | 0.1522 | - | - |
745
+ | 0.3355 | 1200 | 0.1562 | - | - |
746
+ | 0.3634 | 1300 | 0.155 | - | - |
747
+ | 0.3914 | 1400 | 0.1542 | - | - |
748
+ | 0.4193 | 1500 | 0.1326 | - | - |
749
+ | 0.4473 | 1600 | 0.1572 | - | - |
750
+ | 0.4753 | 1700 | 0.1307 | - | - |
751
+ | 0.5032 | 1800 | 0.1428 | - | - |
752
+ | 0.5312 | 1900 | 0.1446 | - | - |
753
+ | 0.5591 | 2000 | 0.1275 | 0.0946 | 0.9849 |
754
+ | 0.5871 | 2100 | 0.1328 | - | - |
755
+ | 0.6150 | 2200 | 0.1235 | - | - |
756
+ | 0.6430 | 2300 | 0.1245 | - | - |
757
+ | 0.6710 | 2400 | 0.1354 | - | - |
758
+ | 0.6989 | 2500 | 0.1217 | - | - |
759
+ | 0.7269 | 2600 | 0.1282 | - | - |
760
+ | 0.7548 | 2700 | 0.1326 | - | - |
761
+ | 0.7828 | 2800 | 0.1109 | - | - |
762
+ | 0.8107 | 2900 | 0.1165 | - | - |
763
+ | 0.8387 | 3000 | 0.1368 | - | - |
764
+ | 0.8666 | 3100 | 0.1174 | - | - |
765
+ | 0.8946 | 3200 | 0.1102 | - | - |
766
+ | 0.9226 | 3300 | 0.1151 | - | - |
767
+ | 0.9505 | 3400 | 0.1218 | - | - |
768
+ | 0.9785 | 3500 | 0.1109 | - | - |
769
+ | 1.0064 | 3600 | 0.1144 | - | - |
770
+ | 1.0344 | 3700 | 0.1148 | - | - |
771
+ | 1.0623 | 3800 | 0.1187 | - | - |
772
+ | 1.0903 | 3900 | 0.1126 | - | - |
773
+ | 1.1183 | 4000 | 0.1102 | 0.0833 | 0.9862 |
774
+ | 1.1462 | 4100 | 0.101 | - | - |
775
+ | 1.1742 | 4200 | 0.1137 | - | - |
776
+ | 1.2021 | 4300 | 0.0936 | - | - |
777
+ | 1.2301 | 4400 | 0.0889 | - | - |
778
+ | 1.2580 | 4500 | 0.0966 | - | - |
779
+ | 1.2860 | 4600 | 0.0803 | - | - |
780
+ | 1.3140 | 4700 | 0.0896 | - | - |
781
+ | 1.3419 | 4800 | 0.095 | - | - |
782
+ | 1.3699 | 4900 | 0.0979 | - | - |
783
+ | 1.3978 | 5000 | 0.0973 | - | - |
784
+ | 1.4258 | 5100 | 0.0911 | - | - |
785
+ | 1.4537 | 5200 | 0.1029 | - | - |
786
+ | 1.4817 | 5300 | 0.0914 | - | - |
787
+ | 1.5096 | 5400 | 0.0909 | - | - |
788
+ | 1.5376 | 5500 | 0.0923 | - | - |
789
+ | 1.5656 | 5600 | 0.0856 | - | - |
790
+ | 1.5935 | 5700 | 0.0849 | - | - |
791
+ | 1.6215 | 5800 | 0.0835 | - | - |
792
+ | 1.6494 | 5900 | 0.0957 | - | - |
793
+ | 1.6774 | 6000 | 0.0951 | 0.0768 | 0.9887 |
794
+ | 1.7053 | 6100 | 0.0818 | - | - |
795
+ | 1.7333 | 6200 | 0.099 | - | - |
796
+ | 1.7613 | 6300 | 0.0893 | - | - |
797
+ | 1.7892 | 6400 | 0.0897 | - | - |
798
+ | 1.8172 | 6500 | 0.0837 | - | - |
799
+ | 1.8451 | 6600 | 0.0993 | - | - |
800
+ | 1.8731 | 6700 | 0.0855 | - | - |
801
+ | 1.9010 | 6800 | 0.0852 | - | - |
802
+ | 1.9290 | 6900 | 0.0823 | - | - |
803
+ | 1.9569 | 7000 | 0.0869 | - | - |
804
+ | 1.9849 | 7100 | 0.0823 | - | - |
805
+ | 2.0129 | 7200 | 0.0851 | - | - |
806
+ | 2.0408 | 7300 | 0.0833 | - | - |
807
+ | 2.0688 | 7400 | 0.0873 | - | - |
808
+ | 2.0967 | 7500 | 0.0857 | - | - |
809
+ | 2.1247 | 7600 | 0.0828 | - | - |
810
+ | 2.1526 | 7700 | 0.0717 | - | - |
811
+ | 2.1806 | 7800 | 0.0967 | - | - |
812
+ | 2.2086 | 7900 | 0.0713 | - | - |
813
+ | 2.2365 | 8000 | 0.0782 | 0.0742 | 0.9882 |
814
+ | 2.2645 | 8100 | 0.0681 | - | - |
815
+ | 2.2924 | 8200 | 0.0689 | - | - |
816
+ | 2.3204 | 8300 | 0.0689 | - | - |
817
+ | 2.3483 | 8400 | 0.0753 | - | - |
818
+ | 2.3763 | 8500 | 0.0777 | - | - |
819
+ | 2.4042 | 8600 | 0.0805 | - | - |
820
+ | 2.4322 | 8700 | 0.0787 | - | - |
821
+ | 2.4602 | 8800 | 0.0731 | - | - |
822
+ | 2.4881 | 8900 | 0.0743 | - | - |
823
+ | 2.5161 | 9000 | 0.0735 | - | - |
824
+ | 2.5440 | 9100 | 0.074 | - | - |
825
+ | 2.5720 | 9200 | 0.0663 | - | - |
826
+ | 2.5999 | 9300 | 0.0706 | - | - |
827
+ | 2.6279 | 9400 | 0.0675 | - | - |
828
+ | 2.6559 | 9500 | 0.0796 | - | - |
829
+ | 2.6838 | 9600 | 0.074 | - | - |
830
+ | 2.7118 | 9700 | 0.0703 | - | - |
831
+ | 2.7397 | 9800 | 0.0746 | - | - |
832
+ | 2.7677 | 9900 | 0.0738 | - | - |
833
+ | 2.7956 | 10000 | 0.076 | 0.0714 | 0.9885 |
834
+ | 2.8236 | 10100 | 0.0681 | - | - |
835
+ | 2.8516 | 10200 | 0.0797 | - | - |
836
+ | 2.8795 | 10300 | 0.0678 | - | - |
837
+ | 2.9075 | 10400 | 0.0715 | - | - |
838
+ | 2.9354 | 10500 | 0.0733 | - | - |
839
+ | 2.9634 | 10600 | 0.0659 | - | - |
840
+ | 2.9913 | 10700 | 0.0687 | - | - |
841
+
842
+ </details>
843
+
844
  ### Framework Versions
845
+ - Python: 3.10.12
846
+ - Sentence Transformers: 3.2.0
847
+ - Transformers: 4.45.2
848
+ - PyTorch: 2.4.0+cu121
849
+ - Accelerate: 1.0.1
850
+ - Datasets: 3.0.2
851
+ - Tokenizers: 0.20.1
852
 
853
  ## Citation
854
 
855
  ### BibTeX
856
 
857
+ #### Sentence Transformers
858
+ ```bibtex
859
+ @inproceedings{reimers-2019-sentence-bert,
860
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
861
+ author = "Reimers, Nils and Gurevych, Iryna",
862
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
863
+ month = "11",
864
+ year = "2019",
865
+ publisher = "Association for Computational Linguistics",
866
+ url = "https://arxiv.org/abs/1908.10084",
867
+ }
868
+ ```
869
+
870
+ #### MultipleNegativesRankingLoss
871
+ ```bibtex
872
+ @misc{henderson2017efficient,
873
+ title={Efficient Natural Language Response Suggestion for Smart Reply},
874
+ author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
875
+ year={2017},
876
+ eprint={1705.00652},
877
+ archivePrefix={arXiv},
878
+ primaryClass={cs.CL}
879
+ }
880
+ ```
881
+
882
  <!--
883
  ## Glossary
884
 
config.json CHANGED
@@ -1,5 +1,5 @@
1
  {
2
- "_name_or_path": "/kaggle/working/model",
3
  "architectures": [
4
  "XLMRobertaModel"
5
  ],
@@ -13,7 +13,7 @@
13
  "initializer_range": 0.02,
14
  "intermediate_size": 4096,
15
  "layer_norm_eps": 1e-05,
16
- "max_position_embeddings": 8194,
17
  "model_type": "xlm-roberta",
18
  "num_attention_heads": 16,
19
  "num_hidden_layers": 24,
@@ -21,7 +21,7 @@
21
  "pad_token_id": 1,
22
  "position_embedding_type": "absolute",
23
  "torch_dtype": "float32",
24
- "transformers_version": "4.45.1",
25
  "type_vocab_size": 1,
26
  "use_cache": true,
27
  "vocab_size": 250002
 
1
  {
2
+ "_name_or_path": "intfloat/multilingual-e5-large-instruct",
3
  "architectures": [
4
  "XLMRobertaModel"
5
  ],
 
13
  "initializer_range": 0.02,
14
  "intermediate_size": 4096,
15
  "layer_norm_eps": 1e-05,
16
+ "max_position_embeddings": 514,
17
  "model_type": "xlm-roberta",
18
  "num_attention_heads": 16,
19
  "num_hidden_layers": 24,
 
21
  "pad_token_id": 1,
22
  "position_embedding_type": "absolute",
23
  "torch_dtype": "float32",
24
+ "transformers_version": "4.45.2",
25
  "type_vocab_size": 1,
26
  "use_cache": true,
27
  "vocab_size": 250002
config_sentence_transformers.json CHANGED
@@ -1,8 +1,8 @@
1
  {
2
  "__version__": {
3
- "sentence_transformers": "3.2.1",
4
- "transformers": "4.45.1",
5
- "pytorch": "2.4.0"
6
  },
7
  "prompts": {},
8
  "default_prompt_name": null,
 
1
  {
2
  "__version__": {
3
+ "sentence_transformers": "3.2.0",
4
+ "transformers": "4.45.2",
5
+ "pytorch": "2.4.0+cu121"
6
  },
7
  "prompts": {},
8
  "default_prompt_name": null,
model.safetensors CHANGED
@@ -1,3 +1,3 @@
1
  version https://git-lfs.github.com/spec/v1
2
- oid sha256:67bffc800d7edb5d24f94ee8fc969fa445158e18a861f99951fb6b5eb4d7a8e7
3
- size 2271064456
 
1
  version https://git-lfs.github.com/spec/v1
2
+ oid sha256:d0d642a915473631cdf27ac25ca63d7fdd75a3bc3ef6cac2202cbcd63043cf20
3
+ size 2239607176
modules.json CHANGED
@@ -14,7 +14,25 @@
14
  {
15
  "idx": 2,
16
  "name": "2",
17
- "path": "2_Normalize",
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
18
  "type": "sentence_transformers.models.Normalize"
19
  }
20
  ]
 
14
  {
15
  "idx": 2,
16
  "name": "2",
17
+ "path": "2_Dense",
18
+ "type": "sentence_transformers.models.Dense"
19
+ },
20
+ {
21
+ "idx": 3,
22
+ "name": "3",
23
+ "path": "3_Dropout",
24
+ "type": "sentence_transformers.models.Dropout"
25
+ },
26
+ {
27
+ "idx": 4,
28
+ "name": "4",
29
+ "path": "4_Dense",
30
+ "type": "sentence_transformers.models.Dense"
31
+ },
32
+ {
33
+ "idx": 5,
34
+ "name": "5",
35
+ "path": "5_Normalize",
36
  "type": "sentence_transformers.models.Normalize"
37
  }
38
  ]
sentence_bert_config.json CHANGED
@@ -1,4 +1,4 @@
1
  {
2
- "max_seq_length": 8192,
3
  "do_lower_case": false
4
  }
 
1
  {
2
+ "max_seq_length": 512,
3
  "do_lower_case": false
4
  }
tokenizer.json CHANGED
@@ -1,3 +1,3 @@
1
  version https://git-lfs.github.com/spec/v1
2
- oid sha256:b74659c780d49afad7a7b9799868f75cbd3014fb6c34956e85a793028d38094a
3
- size 17098251
 
1
  version https://git-lfs.github.com/spec/v1
2
+ oid sha256:883b037111086fd4dfebbbc9b7cee11e1517b5e0c0514879478661440f137085
3
+ size 17082987
tokenizer_config.json CHANGED
@@ -41,15 +41,15 @@
41
  "special": true
42
  }
43
  },
 
44
  "bos_token": "<s>",
45
  "clean_up_tokenization_spaces": true,
46
  "cls_token": "<s>",
47
  "eos_token": "</s>",
48
  "mask_token": "<mask>",
49
- "model_max_length": 8192,
50
  "pad_token": "<pad>",
51
  "sep_token": "</s>",
52
- "sp_model_kwargs": {},
53
  "tokenizer_class": "XLMRobertaTokenizer",
54
  "unk_token": "<unk>"
55
  }
 
41
  "special": true
42
  }
43
  },
44
+ "additional_special_tokens": [],
45
  "bos_token": "<s>",
46
  "clean_up_tokenization_spaces": true,
47
  "cls_token": "<s>",
48
  "eos_token": "</s>",
49
  "mask_token": "<mask>",
50
+ "model_max_length": 512,
51
  "pad_token": "<pad>",
52
  "sep_token": "</s>",
 
53
  "tokenizer_class": "XLMRobertaTokenizer",
54
  "unk_token": "<unk>"
55
  }