Upload folder using huggingface_hub
Browse files- 1_Pooling/config.json +2 -2
- 2_Dense/config.json +1 -0
- 2_Dense/model.safetensors +3 -0
- 3_Dropout/config.json +1 -0
- 4_Dense/config.json +1 -0
- 4_Dense/model.safetensors +3 -0
- README.md +774 -17
- config.json +3 -3
- config_sentence_transformers.json +3 -3
- model.safetensors +2 -2
- modules.json +19 -1
- sentence_bert_config.json +1 -1
- tokenizer.json +2 -2
- tokenizer_config.json +2 -2
1_Pooling/config.json
CHANGED
@@ -1,7 +1,7 @@
|
|
1 |
{
|
2 |
"word_embedding_dimension": 1024,
|
3 |
-
"pooling_mode_cls_token":
|
4 |
-
"pooling_mode_mean_tokens":
|
5 |
"pooling_mode_max_tokens": false,
|
6 |
"pooling_mode_mean_sqrt_len_tokens": false,
|
7 |
"pooling_mode_weightedmean_tokens": false,
|
|
|
1 |
{
|
2 |
"word_embedding_dimension": 1024,
|
3 |
+
"pooling_mode_cls_token": false,
|
4 |
+
"pooling_mode_mean_tokens": true,
|
5 |
"pooling_mode_max_tokens": false,
|
6 |
"pooling_mode_mean_sqrt_len_tokens": false,
|
7 |
"pooling_mode_weightedmean_tokens": false,
|
2_Dense/config.json
ADDED
@@ -0,0 +1 @@
|
|
|
|
|
1 |
+
{"in_features": 1024, "out_features": 1024, "bias": true, "activation_function": "torch.nn.modules.linear.Identity"}
|
2_Dense/model.safetensors
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:11e5ec33e45c62a8b41ad5f64553bac70eb5992264dbd71441b89c5aa5a9eb53
|
3 |
+
size 4198560
|
3_Dropout/config.json
ADDED
@@ -0,0 +1 @@
|
|
|
|
|
1 |
+
{"dropout": 0.1}
|
4_Dense/config.json
ADDED
@@ -0,0 +1 @@
|
|
|
|
|
1 |
+
{"in_features": 1024, "out_features": 1024, "bias": true, "activation_function": "torch.nn.modules.activation.Tanh"}
|
4_Dense/model.safetensors
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:783ec5c077e67a3272687bb13167ee6ba6b94e4d1191ad15d554fc80e7bdf12b
|
3 |
+
size 4198560
|
README.md
CHANGED
@@ -1,22 +1,438 @@
|
|
1 |
---
|
|
|
2 |
library_name: sentence-transformers
|
|
|
|
|
|
|
|
|
|
|
|
|
3 |
pipeline_tag: sentence-similarity
|
4 |
tags:
|
5 |
- sentence-transformers
|
6 |
- sentence-similarity
|
7 |
- feature-extraction
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
8 |
---
|
9 |
|
10 |
-
# SentenceTransformer
|
11 |
|
12 |
-
This is a [sentence-transformers](https://www.SBERT.net) model
|
13 |
|
14 |
## Model Details
|
15 |
|
16 |
### Model Description
|
17 |
- **Model Type:** Sentence Transformer
|
18 |
-
|
19 |
-
- **Maximum Sequence Length:**
|
20 |
- **Output Dimensionality:** 1024 tokens
|
21 |
- **Similarity Function:** Cosine Similarity
|
22 |
<!-- - **Training Dataset:** Unknown -->
|
@@ -33,9 +449,14 @@ This is a [sentence-transformers](https://www.SBERT.net) model trained. It maps
|
|
33 |
|
34 |
```
|
35 |
SentenceTransformer(
|
36 |
-
(0): Transformer({'max_seq_length':
|
37 |
-
(1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token':
|
38 |
-
(2):
|
|
|
|
|
|
|
|
|
|
|
39 |
)
|
40 |
```
|
41 |
|
@@ -57,9 +478,9 @@ from sentence_transformers import SentenceTransformer
|
|
57 |
model = SentenceTransformer("sentence_transformers_model_id")
|
58 |
# Run inference
|
59 |
sentences = [
|
60 |
-
'
|
61 |
-
|
62 |
-
'
|
63 |
]
|
64 |
embeddings = model.encode(sentences)
|
65 |
print(embeddings.shape)
|
@@ -95,6 +516,22 @@ You can finetune this model on your own dataset.
|
|
95 |
*List how the model may foreseeably be misused and address what users ought not to do with the model.*
|
96 |
-->
|
97 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
98 |
<!--
|
99 |
## Bias, Risks and Limitations
|
100 |
|
@@ -109,19 +546,339 @@ You can finetune this model on your own dataset.
|
|
109 |
|
110 |
## Training Details
|
111 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
112 |
### Framework Versions
|
113 |
-
- Python: 3.10.
|
114 |
-
- Sentence Transformers: 3.2.
|
115 |
-
- Transformers: 4.45.
|
116 |
-
- PyTorch: 2.4.0
|
117 |
-
- Accelerate: 0.
|
118 |
-
- Datasets: 3.0.
|
119 |
-
- Tokenizers: 0.20.
|
120 |
|
121 |
## Citation
|
122 |
|
123 |
### BibTeX
|
124 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
125 |
<!--
|
126 |
## Glossary
|
127 |
|
|
|
1 |
---
|
2 |
+
base_model: intfloat/multilingual-e5-large-instruct
|
3 |
library_name: sentence-transformers
|
4 |
+
metrics:
|
5 |
+
- cosine_accuracy
|
6 |
+
- dot_accuracy
|
7 |
+
- manhattan_accuracy
|
8 |
+
- euclidean_accuracy
|
9 |
+
- max_accuracy
|
10 |
pipeline_tag: sentence-similarity
|
11 |
tags:
|
12 |
- sentence-transformers
|
13 |
- sentence-similarity
|
14 |
- feature-extraction
|
15 |
+
- generated_from_trainer
|
16 |
+
- dataset_size:114456
|
17 |
+
- loss:MultipleNegativesRankingLoss
|
18 |
+
widget:
|
19 |
+
- source_sentence: Đối tượng hưởng chính sách ưu đãi đối với công nghiệp hỗ trợ được
|
20 |
+
quy định như thế nào?
|
21 |
+
sentences:
|
22 |
+
- 1. Hoạt động thương mại là hoạt động nhằm mục đích sinh lợi, bao gồm mua bán hàng
|
23 |
+
hoá, cung ứng dịch vụ, đầu tư, xúc tiến thương mại và các hoạt động nhằm mục đích
|
24 |
+
sinh lợi khác.
|
25 |
+
- '"Điều 11. Đối tượng và thủ tục xác nhận ưu đãi
|
26 |
+
|
27 |
+
1. Đối tượng ưu đãi:
|
28 |
+
|
29 |
+
Dự án sản xuất sản phẩm công nghiệp hỗ trợ thuộc Danh mục sản phẩm công nghiệp
|
30 |
+
hỗ trợ ưu tiên phát triển: Bao gồm dự án đầu tư mới, dự án mở rộng và đổi mới
|
31 |
+
công nghệ có ứng dụng thiết bị mới, quy trình sản xuất mới, sản xuất sản phẩm
|
32 |
+
với năng lực sản xuất tăng ít nhất 20%."'
|
33 |
+
- Nghị định này áp dụng đối với tổ chức, cá nhân sử dụng năng lượng tại Việt Nam.
|
34 |
+
- source_sentence: Quy định bãi bỏ các cụm từ liên quan đến sổ hộ khẩu trong hồ sơ
|
35 |
+
cấp giấy xác nhận thân nhân người có công ra sao?
|
36 |
+
sentences:
|
37 |
+
- 'Điều 5. In, sử dụng mẫu sổ quốc tịch, mẫu giấy tờ về quốc tịch
|
38 |
+
|
39 |
+
1. Mẫu sổ quốc tịch, mẫu giấy tờ về quốc tịch ban hành theo Danh mục tại Điều
|
40 |
+
3 và Điều 4 của Thông tư này được đăng tải trên Cổng thông tin điện tử của Bộ
|
41 |
+
Tư pháp (tại địa chỉ: www.moj.gov.vn), cơ quan có thẩm quyền thụ lý hồ sơ giải
|
42 |
+
quyết các việc về quốc tịch được truy cập, tự in để sử dụng.
|
43 |
+
|
44 |
+
2. Người có yêu cầu giải quyết các việc về quốc tịch (sau đây gọi chung là người
|
45 |
+
có yêu cầu) truy cập trên Cổng thông tin điện tử của Bộ Tư pháp để in và sử dụng
|
46 |
+
các mẫu Đơn, Bản khai lý lịch, Tờ khai. Trường hợp người có yêu cầu không thể
|
47 |
+
tự in thì cơ quan có thẩm quyền thụ lý hồ sơ có trách nhiệm in và phát miễn phí
|
48 |
+
cho người có yêu cầu.'
|
49 |
+
- 'Bãi bỏ, thay thế một số cụm từ quy định tại các nghị định
|
50 |
+
|
51 |
+
...
|
52 |
+
|
53 |
+
4. Bãi bỏ cụm từ “hoặc sổ hộ khẩu đã được cấp trước ngày 01 tháng 7 năm 2021”
|
54 |
+
tại điểm b khoản 1 Điều 116 và cụm từ “hoặc sổ hộ khẩu đã được cấp trước ngày
|
55 |
+
01 tháng 7 năm 2021” tại khoản 3 Điều 130 Nghị định số 131/2021/NĐ-CP ngày 30
|
56 |
+
tháng 12 năm 2021 hướng dẫn Pháp lệnh Ưu đãi người có công với cách mạng.'
|
57 |
+
- 'Phương pháp tiến hành
|
58 |
+
|
59 |
+
5.1 Yêu cầu chung
|
60 |
+
|
61 |
+
5.1.1 Mẫu hậu kiểm phải được mã hóa và được gieo trồng cùng với mẫu chuẩn của
|
62 |
+
giống đó.
|
63 |
+
|
64 |
+
5.1.2 Chăm sóc và bón phân theo quy định về khảo nghiệm giá trị canh tác và giá
|
65 |
+
trị sử dụng (khảo nghiệm VCU) của loài cây trồng tương ứng.
|
66 |
+
|
67 |
+
5.1.3 Không loại bỏ cây khác dạng khỏi ô thí nghiệm.
|
68 |
+
|
69 |
+
5.1.4 Các chỉ tiêu định tính: đánh giá bằng mắt, quan sát trên toàn ô thí nghiệm,
|
70 |
+
trên từng cây hoặc từng bộ phận của cây.
|
71 |
+
|
72 |
+
5.1.5 Các chỉ tiêu định lượng: tiến hành lấy mẫu và đánh giá theo quy định về
|
73 |
+
khảo nghiệm VCU của loài cây trồng tương ứng.
|
74 |
+
|
75 |
+
...'
|
76 |
+
- source_sentence: Chủ tịch Ủy ban nhân dân cấp xã hay cấp huyện có thẩm quyền xử
|
77 |
+
phạt hành vi uy hiếp tinh thần người tham gia hoạt động giáo dục về chăm sóc sức
|
78 |
+
khỏe và sử dụng các dịch vụ y tế vì định kiến giới?
|
79 |
+
sentences:
|
80 |
+
- 'Thuế suất 0%
|
81 |
+
|
82 |
+
1. Thuế suất 0%: áp dụng đối với hàng hóa, dịch vụ xuất khẩu; hoạt động xây dựng,
|
83 |
+
lắp đặt công trình ở nước ngoài và ở trong khu phi thuế quan; vận tải quốc tế;
|
84 |
+
hàng hóa, dịch vụ thuộc diện không chịu thuế GTGT khi xuất khẩu, trừ các trường
|
85 |
+
hợp không áp dụng mức thuế suất 0% hướng dẫn tại khoản 3 Điều này.
|
86 |
+
|
87 |
+
Hàng hóa, dịch vụ xuất khẩu là hàng hóa, dịch vụ được bán, cung ứng cho tổ chức,
|
88 |
+
cá nhân ở nước ngoài và tiêu dùng ở ngoài Việt Nam; bán, cung ứng cho tổ chức,
|
89 |
+
cá nhân trong khu phi thuế quan; hàng hóa, dịch vụ cung cấp cho khách h��ng nước
|
90 |
+
ngoài theo quy định của pháp luật.
|
91 |
+
|
92 |
+
a) Hàng hóa xuất khẩu bao gồm:
|
93 |
+
|
94 |
+
- Hàng hóa xuất khẩu ra nước ngoài, kể cả ủy thác xuất khẩu;
|
95 |
+
|
96 |
+
- Hàng hóa bán vào khu phi thuế quan theo quy định của Thủ tướng Chính phủ; hàng
|
97 |
+
bán cho cửa hàng miễn thuế;
|
98 |
+
|
99 |
+
- Hàng hóa bán mà điểm giao, nhận hàng hóa ở ngoài Việt Nam;
|
100 |
+
|
101 |
+
- Phụ tùng, vật tư thay thế để sửa chữa, bảo dưỡng phương tiện, máy móc thiết
|
102 |
+
bị cho bên nước ngoài và tiêu dùng ở ngoài Việt Nam;
|
103 |
+
|
104 |
+
- Các trường hợp được coi là xuất khẩu theo quy định của pháp luật:
|
105 |
+
|
106 |
+
+ Hàng hóa gia công chuyển tiếp theo quy định của pháp luật thương mại về hoạt
|
107 |
+
động mua, bán hàng hóa quốc tế và các hoạt động đại lý mua, bán, gia công hàng
|
108 |
+
hóa với nước ngoài.
|
109 |
+
|
110 |
+
+ Hàng hóa xuất khẩu tại chỗ theo quy định của pháp luật.
|
111 |
+
|
112 |
+
+ Hàng hóa xuất khẩu để bán tại hội chợ, triển lãm ở nước ngoài.
|
113 |
+
|
114 |
+
b) Dịch vụ xuất khẩu bao gồm dịch vụ cung ứng trực tiếp cho tổ chức, cá nhân ở
|
115 |
+
nước ngoài và tiêu dùng ở ngoài Việt Nam; cung ứng trực tiếp cho tổ chức, cá nhân
|
116 |
+
ở trong khu phi thuế quan và tiêu dùng trong khu phi thuế quan.
|
117 |
+
|
118 |
+
Cá nhân ở nước ngoài là người nước ngoài không cư trú tại Việt Nam, người Việt
|
119 |
+
Nam định cư ở nước ngoài và ở ngoài Việt Nam trong thời gian diễn ra việc cung
|
120 |
+
ứng dịch vụ. Tổ chức, cá nhân trong khu phi thuế quan là tổ chức, cá nhân có đăng
|
121 |
+
ký kinh doanh và các trường hợp khác theo quy định của Thủ tướng Chính phủ.
|
122 |
+
|
123 |
+
Trường hợp cung cấp dịch vụ mà hoạt động cung cấp vừa diễn ra tại Việt Nam, vừa
|
124 |
+
diễn ra ở ngoài Việt Nam nhưng hợp đồng dịch vụ được ký kết giữa hai người nộp
|
125 |
+
thuế tại Việt Nam hoặc có cơ sở thường trú tại Việt Nam thì thuế suất 0% chỉ áp
|
126 |
+
dụng đối với phần giá trị dịch vụ thực hiện ở ngoài Việt Nam, trừ trường hợp cung
|
127 |
+
cấp dịch vụ bảo hiểm cho hàng hóa nhập khẩu được áp dụng thuế suất 0% trên toàn
|
128 |
+
bộ giá trị hợp đồng. Trường hợp, hợp đồng không xác định riêng phần giá trị dịch
|
129 |
+
vụ thực hiện tại Việt Nam thì giá tính thuế được xác định theo tỷ lệ (%) chi phí
|
130 |
+
phát sinh tại Việt Nam trên tổng chi phí.
|
131 |
+
|
132 |
+
Cơ sở kinh doanh cung cấp dịch vụ là người nộp thuế tại Việt Nam phải có tài liệu
|
133 |
+
chứng minh dịch vụ thực hiện ở ngoài Việt Nam.
|
134 |
+
|
135 |
+
...'
|
136 |
+
- '1. Thanh tra viên, người được giao thực hiện nhiệm vụ thanh tra chuyên ngành
|
137 |
+
chăn nuôi, thú y đang thi hành công vụ có quyền:
|
138 |
+
|
139 |
+
a) Phạt tiền đến 500.000 đồng đối với lĩnh vực giống vật nuôi, thức ăn chăn nuôi
|
140 |
+
và điều kiện chăn nuôi;
|
141 |
+
|
142 |
+
b) Tịch thu tang vật vi phạm hành chính có giá trị không vượt quá mức xử phạt
|
143 |
+
tiền được quy định tại điểm a khoản này.
|
144 |
+
|
145 |
+
2. Thanh tra viên, người được giao thực hiện nhiệm vụ thanh tra chuyên ngành quản
|
146 |
+
lý chất lượng nông lâm sản và thủy sản đang thi hành công vụ có quyền:
|
147 |
+
|
148 |
+
a) Phạt tiền đến 500.000 đồng đối với lĩnh vực điều kiện chăn nuôi;
|
149 |
+
|
150 |
+
b) Tịch thu tang vật vi phạm hành chính có giá trị không vượt quá mức xử phạt
|
151 |
+
tiền được quy định tại điểm a khoản này.
|
152 |
+
|
153 |
+
3. Thanh tra viên, người được giao thực hiện nhiệm vụ thanh tra chuyên ngành bảo
|
154 |
+
vệ thực vật đang thi hành công vụ có quyền:
|
155 |
+
|
156 |
+
a) Phạt tiền đến 500.000 đồng đối với lĩnh vực thức ăn chăn nuôi;
|
157 |
+
|
158 |
+
b) Tịch thu tang vật vi phạm hành chính có giá trị không vượt quá mức xử phạt
|
159 |
+
tiền được quy định tại điểm a khoản này.
|
160 |
+
|
161 |
+
4. Chánh Thanh tra Sở Nông nghiệp và Phát triển nông thôn, Chi cục trưởng Chi
|
162 |
+
cục có chức năng quản lý chuyên ngành về chăn nuôi, thú y; Trưởng đoàn thanh tra
|
163 |
+
chuyên ngành Cục Chăn nuôi; Trưởng đoàn thanh tra chuyên ngành Sở Nông nghiệp
|
164 |
+
và Phát triển nông thôn; Trưởng đoàn thanh tra chuyên ngành Chi cục có chức năng
|
165 |
+
quản lý chuyên ngành về chăn nuôi, thú y có quyền:
|
166 |
+
|
167 |
+
a) Phạt tiền đến 25.000.000 đồng đối với lĩnh vực giống vật nuôi; 50.000.000 đồng
|
168 |
+
đối với lĩnh vực thức ăn chăn nuôi và điều kiện chăn nuôi;
|
169 |
+
|
170 |
+
b) Đình chỉ hoạt động có thời hạn hoặc tước quyền sử dụng có thời hạn Chứng chỉ
|
171 |
+
đào tạo về thụ tinh nhân tạo, kỹ thuật cấy truyền phôi giống vật nuôi do cơ quan,
|
172 |
+
tổ chức có thẩm quyền cấp;
|
173 |
+
|
174 |
+
c) Tịch thu tang vật vi phạm hành chính có giá trị không vượt quá mức xử phạt
|
175 |
+
tiền được quy định tại điểm a khoản này;
|
176 |
+
|
177 |
+
d) Áp dụng biện pháp khắc phục hậu quả quy định tại các điểm a, b, c, d, đ, e,
|
178 |
+
g, h, k, l, m, n, o, p, q và r khoản 3 Điều 4 của Nghị định này.
|
179 |
+
|
180 |
+
5. Chi cục trưởng Chi cục có chức năng quản lý chuyên ngành về bảo vệ thực vật;
|
181 |
+
Trưởng đoàn thanh tra chuyên ngành Cục Bảo vệ thực vật có quyền:
|
182 |
+
|
183 |
+
a) Phạt tiền đến 50.000.000 đồng đối với lĩnh vực thức ăn chăn nuôi;
|
184 |
+
|
185 |
+
b) Tịch thu tang vật vi phạm hành chính có giá trị không vượt quá mức xử phạt
|
186 |
+
tiền được quy định tại điểm a khoản này;
|
187 |
+
|
188 |
+
c) Áp dụng biện pháp khắc phục hậu quả quy định tại các điểm a, b, c, d, đ, g,
|
189 |
+
h, k và m khoản 3 Điều 4 của Nghị định này.
|
190 |
+
|
191 |
+
6. Chi cục trưởng Chi cục có chức năng quản lý chuyên ngành về quản lý chất lượng
|
192 |
+
nông lâm sản và thủy sản; Trưởng đoàn thanh tra chuyên ngành Cục Quản lý chất
|
193 |
+
lượng nông lâm sản và thủy sản có quyền:
|
194 |
+
|
195 |
+
a) Phạt tiền đến 50.000.000 đồng đối với lĩnh vực điều kiện chăn nuôi;
|
196 |
+
|
197 |
+
b) Tịch thu tang vật vi phạm hành chính có giá trị không vượt quá mức xử phạt
|
198 |
+
tiền được quy định tại điểm a khoản này;
|
199 |
+
|
200 |
+
c) Áp dụng biện pháp khắc phục hậu quả quy định tại các điểm c, d, đ, l và q khoản
|
201 |
+
3 Điều 4 của Nghị định này.
|
202 |
+
|
203 |
+
7. Trưởng đoàn thanh tra chuyên ngành Cục Thú y có quyền:
|
204 |
+
|
205 |
+
a) Phạt tiền đến 50.000.000 đồng đối với lĩnh vực thức ăn chăn nuôi và điều kiện
|
206 |
+
chăn nuôi;
|
207 |
+
|
208 |
+
b) Đình chỉ hoạt động có thời hạn;
|
209 |
+
|
210 |
+
c) Tịch thu tang vật vi phạm hành chính có giá trị không vượt quá mức xử phạt
|
211 |
+
tiền được quy định tại điểm a khoản này;
|
212 |
+
|
213 |
+
d) Áp dụng biện pháp khắc phục hậu quả quy định tại các điểm a, b, c, d, đ, g,
|
214 |
+
h, k, l, m và q khoản 3 Điều 4 của Nghị định này.
|
215 |
+
|
216 |
+
8. Trưởng đoàn thanh tra chuyên ngành về chăn nuôi Bộ Nông nghiệp và Phát triển
|
217 |
+
nông thôn có quyền:
|
218 |
+
|
219 |
+
a) Phạt tiền đến 35.000.000 đồng đối với lĩnh vực giống vật nuôi; 70.000.000 đồng
|
220 |
+
đối với lĩnh vực thức ăn chăn nuôi và điều kiện chăn nuôi;
|
221 |
+
|
222 |
+
b) Đình chỉ hoạt động có thời hạn hoặc tước quyền sử dụng có thời hạn Chứng chỉ
|
223 |
+
đào tạo về thụ tinh nhân tạo, kỹ thuật cấy truyền phôi giống vật nuôi do cơ quan,
|
224 |
+
tổ chức có thẩm quyền cấp;
|
225 |
+
|
226 |
+
c) Tịch thu tang vật vi phạm hành chính có giá trị không vượt quá mức xử phạt
|
227 |
+
tiền được quy định tại điểm a khoản này;
|
228 |
+
|
229 |
+
d) Áp dụng biện pháp khắc phục hậu quả quy định tại khoản 3 Điều 4 của Nghị định
|
230 |
+
này.
|
231 |
+
|
232 |
+
9. Chánh Thanh tra Bộ Nông nghiệp và Phát triển nông thôn, Cục trưởng Cục Chăn
|
233 |
+
nuôi có quyền:
|
234 |
+
|
235 |
+
a) Phạt tiền đến 50.000.000 đồng đối với lĩnh vực giống vật nuôi; 100.000.000
|
236 |
+
đồng đối với lĩnh vực thức ăn chăn nuôi và điều kiện chăn nuôi;
|
237 |
+
|
238 |
+
b) Đình chỉ hoạt động có thời hạn hoặc tước quyền sử dụng có thời hạn Chứng chỉ
|
239 |
+
đào tạo về thụ tinh nhân tạo, kỹ thuật cấy truyền phôi giống vật nuôi do cơ quan,
|
240 |
+
tổ chức có thẩm quyền cấp;
|
241 |
+
|
242 |
+
c) Tịch thu tang vật vi phạm hành chính;
|
243 |
+
|
244 |
+
d) Áp dụng biện pháp khắc phục hậu quả quy định tại khoản 3 Điều 4 của Nghị định
|
245 |
+
này.
|
246 |
+
|
247 |
+
10. Cục trưởng Cục Thú y có quyền:
|
248 |
+
|
249 |
+
a) Phạt tiền đến 100.000.000 đồng đối với lĩnh vực thức ăn chăn nuôi và điều kiện
|
250 |
+
chăn nuôi;
|
251 |
+
|
252 |
+
b) Tịch thu tang vật vi phạm hành chính;
|
253 |
+
|
254 |
+
c) Áp dụng biện pháp khắc phục hậu quả quy định tại các điểm a, b, c, d, đ, g,
|
255 |
+
h, k, l, m và q khoản 3 Điều 4 của Nghị định này.
|
256 |
+
|
257 |
+
11. Cục trưởng Cục Bảo vệ thực vật có quyền:
|
258 |
+
|
259 |
+
a) Phạt tiền đến 100.000.000 đồng đối với lĩnh vực thức ăn chăn nuôi;
|
260 |
+
|
261 |
+
b) Tịch thu tang vật vi phạm hành chính;
|
262 |
+
|
263 |
+
c) Áp dụng biện pháp khắc phục hậu quả quy định tại các điểm a, b, c, d, đ, g,
|
264 |
+
h, k và m khoản 3 Điều 4 của Nghị định này.
|
265 |
+
|
266 |
+
12. Cục trưởng Cục Quản lý chất l��ợng nông lâm sản và thủy sản có quyền:
|
267 |
+
|
268 |
+
a) Phạt tiền đến 100.000.000 đồng đối với lĩnh vực điều kiện chăn nuôi;
|
269 |
+
|
270 |
+
b) Tịch thu tang vật vi phạm hành chính;
|
271 |
+
|
272 |
+
c) Áp dụng biện pháp khắc phục hậu quả quy định tại các điểm c, d, đ, l và q khoản
|
273 |
+
3 Điều 4 của Nghị định này.'
|
274 |
+
- Người có thẩm quyền xử phạt thuộc Công an nhân dân có thẩm quyền xử phạt vi phạm
|
275 |
+
hành chính đối với hành vi quy định tại Điều 6 Nghị định này.
|
276 |
+
- source_sentence: Kết hôn được hiểu như thế nào? Điều kiện để được đăng ký kết hôn
|
277 |
+
được quy định ra sao?
|
278 |
+
sentences:
|
279 |
+
- Các quy định của Bộ luật dân sự và các luật khác có liên quan đến quan hệ hôn
|
280 |
+
nhân và gia đình được áp dụng đối với quan hệ hôn nhân và gia đình trong trường
|
281 |
+
hợp Luật này không quy định.
|
282 |
+
- '"Điều 4. Ngày thi, lịch thi, nội dung thi, hình thức thi và thời gian làm bài
|
283 |
+
thi/môn thi
|
284 |
+
|
285 |
+
1. Ngày thi, lịch thi: Được quy định trong hướng dẫn tổ chức kỳ thi tốt nghiệp
|
286 |
+
THPT hằng năm của Bộ GDĐT.
|
287 |
+
|
288 |
+
2. Nội dung thi: Nội dung thi nằm trong chương trình THPT, chủ yếu là chương trình
|
289 |
+
lớp 12.
|
290 |
+
|
291 |
+
3. Hình thức thi: Các bài thi Toán, Ngoại ngữ, KHTN và KHXH thi theo hình thức
|
292 |
+
trắc nghiệm khách quan (gọi chung là bài thi trắc nghiệm); bài thi Ngữ văn thi
|
293 |
+
theo hình thức tự luận (gọi chung là bài thi tự luận).
|
294 |
+
|
295 |
+
4. Thời gian làm bài thi/môn thi: Ngữ văn 120 phút; Toán 90 phút; Ngoại ngữ 60
|
296 |
+
phút; 50 phút đối với mỗi môn thi thành phần của bài thi tổ hợp KHTN và KHXH."'
|
297 |
+
- '"Điều 8. Điều kiện kết hôn
|
298 |
+
|
299 |
+
1. Nam, nữ kết hôn với nhau phải tuân theo các điều kiện sau đây:
|
300 |
+
|
301 |
+
a) Nam từ đủ 20 tuổi trở lên, nữ từ đủ 18 tuổi trở lên;
|
302 |
+
|
303 |
+
b) Việc kết hôn do nam và nữ tự nguyện quyết định;
|
304 |
+
|
305 |
+
c) Không bị mất năng lực hành vi dân sự;
|
306 |
+
|
307 |
+
d) Việc kết hôn không thuộc một trong các trường hợp cấm kết hôn theo quy định
|
308 |
+
tại các điểm a, b, c và d khoản 2 Điều 5 của Luật này.
|
309 |
+
|
310 |
+
2. Nhà nước không thừa nhận hôn nhân giữa những người cùng giới tính.
|
311 |
+
|
312 |
+
Điều 9. Đăng ký kết hôn
|
313 |
+
|
314 |
+
1. Việc kết hôn phải được đăng ký và do cơ quan nhà nước có thẩm quyền thực hiện
|
315 |
+
theo quy định của Luật này và pháp luật về hộ tịch.
|
316 |
+
|
317 |
+
Việc kết hôn không được đăng ký theo quy định tại khoản này thì không có giá trị
|
318 |
+
pháp lý.
|
319 |
+
|
320 |
+
2. Vợ chồng đã ly hôn muốn xác lập lại quan hệ vợ chồng thì phải đăng ký kết hôn."'
|
321 |
+
- source_sentence: Thời điểm xem xét bổ nhiệm lại công chức lãnh đạo cấp Vụ theo quy
|
322 |
+
định là bao lâu?
|
323 |
+
sentences:
|
324 |
+
- "Thời điểm xem xét bổ nhiệm lại, thời hạn giữ chức vụ\n1. Thời điểm xem xét bổ\
|
325 |
+
\ nhiệm lại \na) Chậm nhất là 90 ngày trước ngày hết thời hạn bổ nhiệm công chức,\
|
326 |
+
\ viên chức cấp vụ và cấp phòng, đơn vị thuộc Bộ phải tiến hành quy trình bổ nhiệm\
|
327 |
+
\ lại để quyết định hoặc trình cấp có thẩm quyền xem xét, quyết định bổ nhiệm\
|
328 |
+
\ lại hoặc không bổ nhiệm lại công chức lãnh đạo, quản lý;\nb) Quyết định bổ nhiệm\
|
329 |
+
\ lại công chức giữ chức vụ lãnh đạo, quản lý phải được ban hành trước ít nhất\
|
330 |
+
\ 01 ngày làm việc, tính đến ngày hết thời hạn bổ nhiệm.\n..."
|
331 |
+
- 'Mức phụ cấp ưu đãi
|
332 |
+
|
333 |
+
1. Mức phụ cấp 70% áp dụng đối với công chức, viên chức thường xuyên, trực tiếp
|
334 |
+
làm các công việc sau đây:
|
335 |
+
|
336 |
+
a) Xét nghiệm, khám, điều trị, chăm sóc người bệnh HIV/AIDS, phong, lao, tâm thần;
|
337 |
+
|
338 |
+
b) Giám định pháp y, pháp y tâm thần, giải phẫu bệnh lý.
|
339 |
+
|
340 |
+
2. Mức phụ cấp 60% áp dụng đối với công chức, viên chức thường xuyên, trực tiếp
|
341 |
+
làm các công việc sau đây:
|
342 |
+
|
343 |
+
a) Khám, điều trị, chăm sóc người bệnh cấp cứu, hồi sức cấp cứu, cấp cứu 115,
|
344 |
+
truyền nhiễm;
|
345 |
+
|
346 |
+
b) Xét nghiệm, phòng chống bệnh truyền nhiễm;
|
347 |
+
|
348 |
+
c) Kiểm dịch y tế biên giới.
|
349 |
+
|
350 |
+
3. Mức phụ cấp 50% áp dụng đối với công chức, viên chức thường xuyên, trực tiếp
|
351 |
+
khám, điều trị, chăm sóc, phục vụ người bệnh gây mê hồi sức, điều trị tích cực,
|
352 |
+
nhi, chống độc, bỏng và da liễu.
|
353 |
+
|
354 |
+
4. Mức phụ cấp 40% áp dụng đối với công chức, viên chức thường xuyên, trực tiếp
|
355 |
+
làm chuyên môn y tế dự phòng; xét nghiệm; khám bệnh, chữa bệnh; kiểm soát nhiễm
|
356 |
+
khuẩn, chăm sóc người bệnh, phục hồi chức năng; giám định y khoa; y dược cổ truyền;
|
357 |
+
dược, mỹ phẩm; an toàn vệ sinh thực phẩm, trang thiết bị y tế; sức khỏe sinh sản
|
358 |
+
tại các cơ sở sự nghiệp y tế công lập và tại các cơ sở điều dưỡng thương binh,
|
359 |
+
bệnh binh, người khuyết tật đặc biệt, trừ các trường hợp quy định tại khoản 1,
|
360 |
+
2 và 3 Điều này.
|
361 |
+
|
362 |
+
5. Mức phụ cấp 30% áp dụng đối với công chức, viên chức sau đây:
|
363 |
+
|
364 |
+
a) Công chức, viên chức thường xuyên, trực tiếp làm chuyên môn y tế để thực hiện
|
365 |
+
các công việc: truyền thông giáo dục sức khỏe; dân số - kế hoạch hóa gia đình;
|
366 |
+
|
367 |
+
b) Công chức, viên chức quản lý, phục vụ không trực tiếp làm chuyên môn y tế tại
|
368 |
+
các cơ sở, viện, bệnh viện chuyên khoa, các trung tâm: HIV/AIDS, phong, lao, tâm
|
369 |
+
thần, giải phẫu bệnh lý, pháp y.
|
370 |
+
|
371 |
+
6. Đối với công chức, viên chức không trực tiếp làm chuyên môn y tế; công chức,
|
372 |
+
viên chức y tế làm công tác quản lý, phục vụ tại các đơn vị sự nghiệp y tế nói
|
373 |
+
chung (trừ đối tượng quy định tại điểm b khoản 5 Điều này), viên chức làm công
|
374 |
+
tác chuyên môn y tế tại cơ quan, đơn vị, trường học thì thủ trưởng đơn vị căn
|
375 |
+
cứ vào đặc thù công việc và nguồn thu để xem xét, quyết định nhưng không vượt
|
376 |
+
quá mức 20% so với mức lương ngạch, bậc hiện hưởng cộng phụ cấp chức vụ lãnh đạo,
|
377 |
+
phụ cấp thâm niên vượt khung (nếu có) của đối tượng được hưởng.7. Mức phụ cấp
|
378 |
+
ưu đãi theo nghề đối với viên chức y tế dự phòng, y tế cơ sở áp dụng từ ngày 01
|
379 |
+
tháng 01 năm 2022 đến hết ngày 31 tháng 12 năm 2023:
|
380 |
+
|
381 |
+
7. Mức phụ cấp ưu đãi theo nghề đối với viên chức y tế dự phòng, y tế cơ sở áp
|
382 |
+
dụng từ ngày 01 tháng 01 năm 2022 đến hết ngày 31 tháng 12 năm 2023:
|
383 |
+
|
384 |
+
a) Mức phụ cấp 100% áp dụng đối với viên chức thường xuyên, trực tiếp làm chuyên
|
385 |
+
môn y tế dự phòng (bao gồm cả kiểm dịch y tế biên giới); làm chuyên môn y tế tại
|
386 |
+
Trạm y tế xã, phường, thị trấn, Phòng khám đa khoa khu vực, Nhà hộ sinh, Trung
|
387 |
+
tâm y tế huyện, quận, thị xã, thành phố thuộc tỉnh, thành phố thuộc thành phố
|
388 |
+
trực thuộc trung ương và bệnh viện tuyến huyện, quận, thị xã, thành phố thuộc
|
389 |
+
tỉnh, thành phố thuộc thành phố trực thuộc trung ương.
|
390 |
+
|
391 |
+
b) Trong thời gian áp dụng mức phụ cấp ưu đãi theo nghề đối với viên chức y tế
|
392 |
+
dự phòng, y tế cơ sở quy định tại khoản 7 này thì không áp dụng quy định tại điểm
|
393 |
+
c khoản 2 và quy định đối với viên chức thường xuyên, trực tiếp làm chuyên môn
|
394 |
+
y tế dự phòng tại khoản 4 Điều 3.'
|
395 |
+
- Khoản 5. Cấp có thẩm quyền bổ nhiệm quyết định tiêu chuẩn, điều kiện về thành
|
396 |
+
tích, kết quả và sản phẩm cụ thể phù hợp để thực hiện việc bổ nhiệm trong thời
|
397 |
+
gian chưa có văn bản hướng dẫn nội dung quy định tại điểm b khoản 2 Điều 33 Nghị
|
398 |
+
định này.
|
399 |
+
model-index:
|
400 |
+
- name: SentenceTransformer based on intfloat/multilingual-e5-large-instruct
|
401 |
+
results:
|
402 |
+
- task:
|
403 |
+
type: triplet
|
404 |
+
name: Triplet
|
405 |
+
dataset:
|
406 |
+
name: Unknown
|
407 |
+
type: unknown
|
408 |
+
metrics:
|
409 |
+
- type: cosine_accuracy
|
410 |
+
value: 0.9885119464969527
|
411 |
+
name: Cosine Accuracy
|
412 |
+
- type: dot_accuracy
|
413 |
+
value: 0.009654279704438811
|
414 |
+
name: Dot Accuracy
|
415 |
+
- type: manhattan_accuracy
|
416 |
+
value: 0.9884040774499757
|
417 |
+
name: Manhattan Accuracy
|
418 |
+
- type: euclidean_accuracy
|
419 |
+
value: 0.9885119464969527
|
420 |
+
name: Euclidean Accuracy
|
421 |
+
- type: max_accuracy
|
422 |
+
value: 0.9885119464969527
|
423 |
+
name: Max Accuracy
|
424 |
---
|
425 |
|
426 |
+
# SentenceTransformer based on intfloat/multilingual-e5-large-instruct
|
427 |
|
428 |
+
This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [intfloat/multilingual-e5-large-instruct](https://huggingface.co/intfloat/multilingual-e5-large-instruct). It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
|
429 |
|
430 |
## Model Details
|
431 |
|
432 |
### Model Description
|
433 |
- **Model Type:** Sentence Transformer
|
434 |
+
- **Base model:** [intfloat/multilingual-e5-large-instruct](https://huggingface.co/intfloat/multilingual-e5-large-instruct) <!-- at revision c9e87c786ffac96aeaeb42863276930883923ecb -->
|
435 |
+
- **Maximum Sequence Length:** 512 tokens
|
436 |
- **Output Dimensionality:** 1024 tokens
|
437 |
- **Similarity Function:** Cosine Similarity
|
438 |
<!-- - **Training Dataset:** Unknown -->
|
|
|
449 |
|
450 |
```
|
451 |
SentenceTransformer(
|
452 |
+
(0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: XLMRobertaModel
|
453 |
+
(1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
|
454 |
+
(2): Dense({'in_features': 1024, 'out_features': 1024, 'bias': True, 'activation_function': 'torch.nn.modules.linear.Identity'})
|
455 |
+
(3): Dropout(
|
456 |
+
(dropout_layer): Dropout(p=0.1, inplace=False)
|
457 |
+
)
|
458 |
+
(4): Dense({'in_features': 1024, 'out_features': 1024, 'bias': True, 'activation_function': 'torch.nn.modules.activation.Tanh'})
|
459 |
+
(5): Normalize()
|
460 |
)
|
461 |
```
|
462 |
|
|
|
478 |
model = SentenceTransformer("sentence_transformers_model_id")
|
479 |
# Run inference
|
480 |
sentences = [
|
481 |
+
'Thời điểm xem xét bổ nhiệm lại công chức lãnh đạo cấp Vụ theo quy định là bao lâu?',
|
482 |
+
'Thời điểm xem xét bổ nhiệm lại, thời hạn giữ chức vụ\n1. Thời điểm xem xét bổ nhiệm lại \na) Chậm nhất là 90 ngày trước ngày hết thời hạn bổ nhiệm công chức, viên chức cấp vụ và cấp phòng, đơn vị thuộc Bộ phải tiến hành quy trình bổ nhiệm lại để quyết định hoặc trình cấp có thẩm quyền xem xét, quyết định bổ nhiệm lại hoặc không bổ nhiệm lại công chức lãnh đạo, quản lý;\nb) Quyết định bổ nhiệm lại công chức giữ chức vụ lãnh đạo, quản lý phải được ban hành trước ít nhất 01 ngày làm việc, tính đến ngày hết thời hạn bổ nhiệm.\n...',
|
483 |
+
'Khoản 5. Cấp có thẩm quyền bổ nhiệm quyết định tiêu chuẩn, điều kiện về thành tích, kết quả và sản phẩm cụ thể phù hợp để thực hiện việc bổ nhiệm trong thời gian chưa có văn bản hướng dẫn nội dung quy định tại điểm b khoản 2 Điều 33 Nghị định này.',
|
484 |
]
|
485 |
embeddings = model.encode(sentences)
|
486 |
print(embeddings.shape)
|
|
|
516 |
*List how the model may foreseeably be misused and address what users ought not to do with the model.*
|
517 |
-->
|
518 |
|
519 |
+
## Evaluation
|
520 |
+
|
521 |
+
### Metrics
|
522 |
+
|
523 |
+
#### Triplet
|
524 |
+
|
525 |
+
* Evaluated with [<code>TripletEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.TripletEvaluator)
|
526 |
+
|
527 |
+
| Metric | Value |
|
528 |
+
|:-------------------|:-----------|
|
529 |
+
| cosine_accuracy | 0.9885 |
|
530 |
+
| dot_accuracy | 0.0097 |
|
531 |
+
| manhattan_accuracy | 0.9884 |
|
532 |
+
| euclidean_accuracy | 0.9885 |
|
533 |
+
| **max_accuracy** | **0.9885** |
|
534 |
+
|
535 |
<!--
|
536 |
## Bias, Risks and Limitations
|
537 |
|
|
|
546 |
|
547 |
## Training Details
|
548 |
|
549 |
+
### Training Dataset
|
550 |
+
|
551 |
+
#### Unnamed Dataset
|
552 |
+
|
553 |
+
|
554 |
+
* Size: 114,456 training samples
|
555 |
+
* Columns: <code>anchor</code>, <code>positive</code>, and <code>negative</code>
|
556 |
+
* Approximate statistics based on the first 1000 samples:
|
557 |
+
| | anchor | positive | negative |
|
558 |
+
|:--------|:----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------|
|
559 |
+
| type | string | string | string |
|
560 |
+
| details | <ul><li>min: 7 tokens</li><li>mean: 24.33 tokens</li><li>max: 55 tokens</li></ul> | <ul><li>min: 23 tokens</li><li>mean: 263.88 tokens</li><li>max: 512 tokens</li></ul> | <ul><li>min: 7 tokens</li><li>mean: 111.33 tokens</li><li>max: 512 tokens</li></ul> |
|
561 |
+
* Samples:
|
562 |
+
| anchor | positive | negative |
|
563 |
+
|:-----------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
|
564 |
+
| <code>Người phát ngôn của Bộ Công thương được quyền phát ngôn trong trường hợp đột xuất nào?</code> | <code>Phát ngôn và cung cấp thông tin trong trường hợp đột xuất, bất thường<br>1. Người phát ngôn Bộ Công an hoặc Người được ủy quyền phát ngôn của Bộ Công an có trách nhiệm phát ngôn và cung cấp thông tin kịp thời, chính xác cho báo chí trong các trường hợp đột xuất, bất thường sau đây:<br>a) Khi Bộ Công an được Chính phủ giao chủ trì xử lý sự cố xảy ra liên quan đến nhiều bộ, ngành, tỉnh, thành phố trực thuộc trung ương;<br>b) Khi xảy ra các sự kiện, vấn đề quan trọng có tác động lớn trong xã hội hoặc khi dư luận xuất hiện nhiều ý kiến không thống nhất về một vấn đề thuộc phạm vi quản lý của Bộ Công an nhằm cảnh báo kịp thời và định hướng dư luận.<br>Trường hợp xảy ra vụ việc cần có ngay thông tin ban đầu của Bộ Công an, Người phát ngôn Bộ Công an hoặc Người được ủy quyền phát ngôn của Bộ Công an có trách nhiệm chủ động phát ngôn, cung cấp thông tin cho báo chí trong thời gian chậm nhất là 24 giờ, kể từ khi vụ việc xảy ra;<br>c) Khi cơ quan báo chí hoặc cơ quan chỉ đạo, quản lý nhà nước về báo chí có yêu cầu phát ngôn và cung cấp thông tin về các sự kiện, vấn đề thuộc phạm vi quản lý nhà nước của Bộ Công an đã được nêu trên báo chí hoặc về các sự kiện, vấn đề quy định tại điểm b khoản này;<br>d) Khi có căn cứ cho rằng báo chí đăng, phát thông tin sai sự thật liên quan đến Bộ Công an, Người phát ngôn Bộ Công an hoặc Người được ủy quyền phát ngôn của Bộ Công an có trách nhiệm yêu cầu cơ quan báo chí đó phải đăng, phát ý kiến phản hồi, cải chính theo quy định của pháp luật.<br>2. Người thực hiện phát ngôn và cung cấp thông tin cho báo chí của đơn vị thuộc Bộ, Công an cấp tỉnh có trách nhiệm phát ngôn và cung cấp thông tin kịp thời, chính xác cho báo chí trong các trường hợp đột xuất, bất thường sau đây:<br>a) Khi xảy ra các sự kiện, vấn đề quan trọng có tác động lớn trong xã hội hoặc khi dư luận xuất hiện nhiều ý kiến không thống nhất về một vấn đề thuộc phạm vi quản lý của cơ quan mình nhằm cảnh báo kịp thời và định hướng dư luận;<br>b) Khi cơ quan báo chí hoặc cơ quan chỉ đạo, quản lý nhà nước về báo chí có yêu cầu phát ngôn và cung cấp thông tin về các sự kiện, vấn đề thuộc phạm vi quản lý nhà nước của cơ quan mình đã được nêu trên báo chí hoặc về các sự kiện, vấn đề quy định tại điểm a khoản này;<br>c) Khi có căn cứ cho rằng báo chí đăng, phát thông tin sai sự thật liên quan đến đơn vị mình, người thực hiện phát ngôn và cung cấp thông tin cho báo chí của đơn vị thuộc Bộ, Công an cấp tỉnh có trách nhiệm yêu cầu cơ quan báo chí đó phải đăng, phát ý kiến phản hồi, cải chính theo quy định của pháp luật;<br>d) Trường hợp cần tổ chức họp báo để cung cấp thông tin cho báo chí thì Thủ trưởng đơn vị thuộc Bộ, Giám đốc Công an cấp tỉnh phải báo cáo, xin ý kiến Bộ trưởng hoặc Thứ trưởng phụ trách</code> | <code>Người phát ngôn được quyền từ chối trả lời những vấn đề về hoạt động của Chính phủ, Thủ tướng Chính phủ không thuộc thẩm quyền phát ngôn; được quyền cải chính những thông tin không đúng sự thật liên quan đến quan điểm và hoạt động của Chính phủ, Thủ tướng Chính phủ</code> |
|
565 |
+
| <code>Lệ phí thực hiện thủ tục công nhận doanh nghiệp ưu tiên trong lĩnh vực hải quan là bao nhiêu?</code> | <code>NỘI DỤNG CỤ THỂ CỦA TỪNG THỦ TỤC HÀNH CHÍNH THUỘC PHẠM VI CHỨC NĂNG QUẢN LÝ CỦA BỘ TÀI CHÍNH<br>1. Tên thủ tục: Thủ tục công nhận doanh nghiệp ưu tiên trong lĩnh vực hải quan<br>...<br>1.7. Kết quả thực hiện thủ tục hành chính:<br>Quyết định công nhận doanh nghiệp ưu tiên (Mẫu 03/DNUT ban hành kèm theo Thông tư 07/2019/TT-BTC ngày 28/01/2019).<br>1.8. Phí, lệ phí: không có.<br>1.9. Tên mẫu đơn, mẫu tờ khai:<br>- Doanh nghiệp xuất khẩu, nhập khẩu hàng hóa và Đại lý làm thủ tục hải quan nộp văn bản đề nghị áp dụng chế độ ưu tiên theo mẫu 02a/DNUT ban hành kèm theo Thông tư 07/2019/TT-BTC ngày 28/01/2019<br>- Tổ chức, cá nhân nhập khẩu hàng hóa để thực hiện dự án đầu tư trọng điểm được Thủ tướng Chính phủ cho ý kiến trước khi cấp phép đầu tư đang trong giai đoạn xây dựng cơ bản nộp văn bản đề nghị áp dụng chế độ ưu tiên theo mẫu 02b/DNUT ban hành kèm theo Thông tư 72/2015/TT-BTC ngày 12/5/2015.<br>...</code> | <code>Quyết định này áp dụng đối với cơ quan nhà nước, doanh nghiệp và tổ chức, cá nhân tham gia hoạt động nhập khẩu, sản xuất và kinh doanh hàng hóa quy định tại khoản 1 và khoản 2 Điều 3 Quyết định này.</code> |
|
566 |
+
| <code>Chuẩn bị phiên họp giải quyết tranh chấp</code> | <code>Điều 54. Chuẩn bị phiên họp giải quyết tranh chấp<br>1. Trường hợp các bên không có thoả thuận khác hoặc quy tắc tố tụng của Trung tâm trọng tài không có quy định khác, thời gian và địa điểm mở phiên họp do Hội đồng trọng tài quyết định.<br>2. Trường hợp các bên không có thoả thuận khác hoặc quy tắc tố tụng của Trung tâm trọng tài không có quy định khác, giấy triệu tập tham dự phiên họp phải được gửi cho các bên chậm nhất 30 ngày trước ngày mở phiên họp.</code> | <code>Điều 3. Giải thích từ ngữ<br>...<br>2. Thoả thuận trọng tài là thoả thuận giữa các bên về việc giải quyết bằng Trọng tài tranh chấp có thể phát sinh hoặc đã phát sinh.</code> |
|
567 |
+
* Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
|
568 |
+
```json
|
569 |
+
{
|
570 |
+
"scale": 20.0,
|
571 |
+
"similarity_fct": "cos_sim"
|
572 |
+
}
|
573 |
+
```
|
574 |
+
|
575 |
+
### Evaluation Dataset
|
576 |
+
|
577 |
+
#### Unnamed Dataset
|
578 |
+
|
579 |
+
|
580 |
+
* Size: 18,541 evaluation samples
|
581 |
+
* Columns: <code>anchor</code>, <code>positive</code>, and <code>negative</code>
|
582 |
+
* Approximate statistics based on the first 1000 samples:
|
583 |
+
| | anchor | positive | negative |
|
584 |
+
|:--------|:----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------|
|
585 |
+
| type | string | string | string |
|
586 |
+
| details | <ul><li>min: 7 tokens</li><li>mean: 24.31 tokens</li><li>max: 51 tokens</li></ul> | <ul><li>min: 13 tokens</li><li>mean: 278.85 tokens</li><li>max: 512 tokens</li></ul> | <ul><li>min: 7 tokens</li><li>mean: 108.66 tokens</li><li>max: 512 tokens</li></ul> |
|
587 |
+
* Samples:
|
588 |
+
| anchor | positive | negative |
|
589 |
+
|:-----------------------------------------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
|
590 |
+
| <code>Địa điểm, cơ sở hạ tầng, trang thiết bị khảo nghiệm tính đồng nhất giống ngô được quy định như thế nào?</code> | <code>Yêu cầu về khảo nghiệm<br>4.1 Yêu cầu về địa điểm, cơ sở hạ tầng, trang thiết bị khảo nghiệm tính khác biệt, tính đồng nhất và tính ổn định giống lúa<br>- Tổ chức thử nghiệm giống, sản phẩm cây trồng được cơ quan có thẩm quyền cấp giấy chứng nhận đăng ký hoạt động để kiểm tra chất lượng hạt giống gửi khảo nghiệm (ngoại trừ chỉ tiêu hạt khác giống) và phân tích các chỉ tiêu chất lượng sản phẩm cây trồng theo quy định tại 5.2.1;<br>- Kho lưu mẫu giống khảo nghiệm và mẫu chuẩn: phải có thiết bị làm mát, điều chỉnh được nhiệt độ, ẩm độ. Đảm bảo nhiệt độ từ 5 °C đến 15 °C, độ ẩm tương đối từ 40 % đến 60 %. Thể tích kho tối thiểu 20 m3;<br>- Trang thiết bị phục vụ cho quá trình khảo nghiệm như: kính lúp, bảng so màu, máy tính, máy in, thiết bị ghi hình, phần mềm xử lý số liệu;<br>- Thiết bị, dụng cụ đo lường đã được kiểm định hoặc hiệu chuẩn định kỳ theo quy định, bao gồm: cân điện tử độ chính xác 0,1 g hoặc 0,01 g; cân có thể cân ít nhất 10 kg; máy đo độ ẩm hạt; dụng cụ đo nhiệt độ và độ ẩm, dụng cụ đo pH, kính hiển vi có độ phóng đại đến 400 lần;<br>- Vật dụng để thiết kế, triển khai thí nghiệm trên đồng ruộng như: thước, bình phun hoặc máy phun thuốc bảo vệ thực vật, bảng, biển hiệu phục vụ khảo nghiệm và các dụng cụ cần thiết khác;<br>- Trang bị bảo hộ lao động bao gồm: khẩu trang, quần áo bảo hộ lao động, ủng, găng tay;<br>- Đủ diện tích đất để bố trí khảo nghiệm trên đồng ruộng, tối thiểu là 140 m2;<br>- Bộ mẫu chuẩn của các giống biết đến rộng rãi.<br>...</code> | <code>Khoản 1.12. Phụ lục 12: Yêu cầu kỹ thuật và phương pháp thử đối với trinatri citrat</code> |
|
591 |
+
| <code>Hoạt động thương mại có những đặc điểm nào?</code> | <code>1. Hoạt động thương mại là hoạt động nhằm mục đích sinh lợi, bao gồm mua bán hàng hoá, cung ứng dịch vụ, đầu tư, xúc tiến thương mại và các hoạt động nhằm mục đích sinh lợi khác.</code> | <code>Điều 2. Sửa đổi, bổ sung một số điều Nghị định số 20/2006/NĐ-CP ngày 20 tháng 02 năm 2006 của Chính phủ quy định chi tiết Luật Thương mại về kinh doanh dịch vụ giám định thương mại</code> |
|
592 |
+
| <code>Cơ cấu tổ chức của Hội đồng phối hợp phổ biến giáo dục pháp luật Bộ Công an bao gồm những thành phần nào?</code> | <code>Cơ cấu tổ chức của Hội đồng, chế độ làm việc và con dấu của Hội đồng<br>...<br>2. Chế độ làm việc của Hội đồng<br>a) Hội đồng làm việc theo nguyên tắc thảo luận tập thể, phát huy vai trò của từng thành viên Hội đồng;<br>b) Các thành viên Hội đồng làm việc theo chế độ kiêm nhiệm;<br>c) Hội đồng họp định kỳ 2 lần/năm, họp đột xuất theo yêu cầu của Chủ tịch Hội đồng hoặc theo ý kiến của tối thiểu ½ Ủy viên Hội đồng.<br>3. Con dấu của Hội đồng<br>Hội đồng sử dụng con dấu của Bộ Công an. Trong trường hợp Phó Chủ tịch Thường trực Hội đồng ký thay Chủ tịch Hội đồng thì sử dụng con dấu của Cơ quan Thường trực Hội đồng.<br>4. Mối quan hệ giữa Hội đồng với các Tổng cục, Bộ Tư lệnh, đơn vị trực thuộc Bộ, Công an, Cảnh sát phòng cháy và chữa cháy tỉnh, thành phố trực thuộc Trung ương (Công an các đơn vị, địa phương)<br>a) Hội đồng phối hợp phổ biến, giáo dục pháp luật Bộ Công an hướng dẫn, kiểm tra hoạt động phối hợp phổ biến, giáo dục pháp luật của Công an các đơn vị, địa phương;<br>b) Công an các đơn vị, địa phương định kỳ sáu tháng, một năm có trách nhiệm báo cáo kết quả hoạt động phổ biến, giáo dục pháp luật của đơn vị, địa phương mình với Hội đồng phối hợp phổ biến, giáo dục pháp luật Bộ Công an (qua Cơ quan Thường trực Hội đồng).</code> | <code>Thông tư này hướng dẫn về nghiệp vụ để thực hiện chức năng, nhiệm vụ, quyền hạn của các tổ chức pháp chế.</code> |
|
593 |
+
* Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
|
594 |
+
```json
|
595 |
+
{
|
596 |
+
"scale": 20.0,
|
597 |
+
"similarity_fct": "cos_sim"
|
598 |
+
}
|
599 |
+
```
|
600 |
+
|
601 |
+
### Training Hyperparameters
|
602 |
+
#### Non-Default Hyperparameters
|
603 |
+
|
604 |
+
- `eval_strategy`: steps
|
605 |
+
- `per_device_train_batch_size`: 32
|
606 |
+
- `per_device_eval_batch_size`: 32
|
607 |
+
- `warmup_ratio`: 0.1
|
608 |
+
- `bf16`: True
|
609 |
+
- `batch_sampler`: no_duplicates
|
610 |
+
|
611 |
+
#### All Hyperparameters
|
612 |
+
<details><summary>Click to expand</summary>
|
613 |
+
|
614 |
+
- `overwrite_output_dir`: False
|
615 |
+
- `do_predict`: False
|
616 |
+
- `eval_strategy`: steps
|
617 |
+
- `prediction_loss_only`: True
|
618 |
+
- `per_device_train_batch_size`: 32
|
619 |
+
- `per_device_eval_batch_size`: 32
|
620 |
+
- `per_gpu_train_batch_size`: None
|
621 |
+
- `per_gpu_eval_batch_size`: None
|
622 |
+
- `gradient_accumulation_steps`: 1
|
623 |
+
- `eval_accumulation_steps`: None
|
624 |
+
- `torch_empty_cache_steps`: None
|
625 |
+
- `learning_rate`: 5e-05
|
626 |
+
- `weight_decay`: 0.0
|
627 |
+
- `adam_beta1`: 0.9
|
628 |
+
- `adam_beta2`: 0.999
|
629 |
+
- `adam_epsilon`: 1e-08
|
630 |
+
- `max_grad_norm`: 1.0
|
631 |
+
- `num_train_epochs`: 3
|
632 |
+
- `max_steps`: -1
|
633 |
+
- `lr_scheduler_type`: linear
|
634 |
+
- `lr_scheduler_kwargs`: {}
|
635 |
+
- `warmup_ratio`: 0.1
|
636 |
+
- `warmup_steps`: 0
|
637 |
+
- `log_level`: passive
|
638 |
+
- `log_level_replica`: warning
|
639 |
+
- `log_on_each_node`: True
|
640 |
+
- `logging_nan_inf_filter`: True
|
641 |
+
- `save_safetensors`: True
|
642 |
+
- `save_on_each_node`: False
|
643 |
+
- `save_only_model`: False
|
644 |
+
- `restore_callback_states_from_checkpoint`: False
|
645 |
+
- `no_cuda`: False
|
646 |
+
- `use_cpu`: False
|
647 |
+
- `use_mps_device`: False
|
648 |
+
- `seed`: 42
|
649 |
+
- `data_seed`: None
|
650 |
+
- `jit_mode_eval`: False
|
651 |
+
- `use_ipex`: False
|
652 |
+
- `bf16`: True
|
653 |
+
- `fp16`: False
|
654 |
+
- `fp16_opt_level`: O1
|
655 |
+
- `half_precision_backend`: auto
|
656 |
+
- `bf16_full_eval`: False
|
657 |
+
- `fp16_full_eval`: False
|
658 |
+
- `tf32`: None
|
659 |
+
- `local_rank`: 0
|
660 |
+
- `ddp_backend`: None
|
661 |
+
- `tpu_num_cores`: None
|
662 |
+
- `tpu_metrics_debug`: False
|
663 |
+
- `debug`: []
|
664 |
+
- `dataloader_drop_last`: False
|
665 |
+
- `dataloader_num_workers`: 0
|
666 |
+
- `dataloader_prefetch_factor`: None
|
667 |
+
- `past_index`: -1
|
668 |
+
- `disable_tqdm`: False
|
669 |
+
- `remove_unused_columns`: True
|
670 |
+
- `label_names`: None
|
671 |
+
- `load_best_model_at_end`: False
|
672 |
+
- `ignore_data_skip`: False
|
673 |
+
- `fsdp`: []
|
674 |
+
- `fsdp_min_num_params`: 0
|
675 |
+
- `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
|
676 |
+
- `fsdp_transformer_layer_cls_to_wrap`: None
|
677 |
+
- `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
|
678 |
+
- `deepspeed`: None
|
679 |
+
- `label_smoothing_factor`: 0.0
|
680 |
+
- `optim`: adamw_torch
|
681 |
+
- `optim_args`: None
|
682 |
+
- `adafactor`: False
|
683 |
+
- `group_by_length`: False
|
684 |
+
- `length_column_name`: length
|
685 |
+
- `ddp_find_unused_parameters`: None
|
686 |
+
- `ddp_bucket_cap_mb`: None
|
687 |
+
- `ddp_broadcast_buffers`: False
|
688 |
+
- `dataloader_pin_memory`: True
|
689 |
+
- `dataloader_persistent_workers`: False
|
690 |
+
- `skip_memory_metrics`: True
|
691 |
+
- `use_legacy_prediction_loop`: False
|
692 |
+
- `push_to_hub`: False
|
693 |
+
- `resume_from_checkpoint`: None
|
694 |
+
- `hub_model_id`: None
|
695 |
+
- `hub_strategy`: every_save
|
696 |
+
- `hub_private_repo`: False
|
697 |
+
- `hub_always_push`: False
|
698 |
+
- `gradient_checkpointing`: False
|
699 |
+
- `gradient_checkpointing_kwargs`: None
|
700 |
+
- `include_inputs_for_metrics`: False
|
701 |
+
- `eval_do_concat_batches`: True
|
702 |
+
- `fp16_backend`: auto
|
703 |
+
- `push_to_hub_model_id`: None
|
704 |
+
- `push_to_hub_organization`: None
|
705 |
+
- `mp_parameters`:
|
706 |
+
- `auto_find_batch_size`: False
|
707 |
+
- `full_determinism`: False
|
708 |
+
- `torchdynamo`: None
|
709 |
+
- `ray_scope`: last
|
710 |
+
- `ddp_timeout`: 1800
|
711 |
+
- `torch_compile`: False
|
712 |
+
- `torch_compile_backend`: None
|
713 |
+
- `torch_compile_mode`: None
|
714 |
+
- `dispatch_batches`: None
|
715 |
+
- `split_batches`: None
|
716 |
+
- `include_tokens_per_second`: False
|
717 |
+
- `include_num_input_tokens_seen`: False
|
718 |
+
- `neftune_noise_alpha`: None
|
719 |
+
- `optim_target_modules`: None
|
720 |
+
- `batch_eval_metrics`: False
|
721 |
+
- `eval_on_start`: False
|
722 |
+
- `use_liger_kernel`: False
|
723 |
+
- `eval_use_gather_object`: False
|
724 |
+
- `batch_sampler`: no_duplicates
|
725 |
+
- `multi_dataset_batch_sampler`: proportional
|
726 |
+
|
727 |
+
</details>
|
728 |
+
|
729 |
+
### Training Logs
|
730 |
+
<details><summary>Click to expand</summary>
|
731 |
+
|
732 |
+
| Epoch | Step | Training Loss | Validation Loss | max_accuracy |
|
733 |
+
|:------:|:-----:|:-------------:|:---------------:|:------------:|
|
734 |
+
| 0.0280 | 100 | 2.4949 | - | - |
|
735 |
+
| 0.0559 | 200 | 0.6501 | - | - |
|
736 |
+
| 0.0839 | 300 | 0.3105 | - | - |
|
737 |
+
| 0.1118 | 400 | 0.2505 | - | - |
|
738 |
+
| 0.1398 | 500 | 0.2088 | - | - |
|
739 |
+
| 0.1677 | 600 | 0.1804 | - | - |
|
740 |
+
| 0.1957 | 700 | 0.1977 | - | - |
|
741 |
+
| 0.2237 | 800 | 0.1602 | - | - |
|
742 |
+
| 0.2516 | 900 | 0.1663 | - | - |
|
743 |
+
| 0.2796 | 1000 | 0.1513 | - | - |
|
744 |
+
| 0.3075 | 1100 | 0.1522 | - | - |
|
745 |
+
| 0.3355 | 1200 | 0.1562 | - | - |
|
746 |
+
| 0.3634 | 1300 | 0.155 | - | - |
|
747 |
+
| 0.3914 | 1400 | 0.1542 | - | - |
|
748 |
+
| 0.4193 | 1500 | 0.1326 | - | - |
|
749 |
+
| 0.4473 | 1600 | 0.1572 | - | - |
|
750 |
+
| 0.4753 | 1700 | 0.1307 | - | - |
|
751 |
+
| 0.5032 | 1800 | 0.1428 | - | - |
|
752 |
+
| 0.5312 | 1900 | 0.1446 | - | - |
|
753 |
+
| 0.5591 | 2000 | 0.1275 | 0.0946 | 0.9849 |
|
754 |
+
| 0.5871 | 2100 | 0.1328 | - | - |
|
755 |
+
| 0.6150 | 2200 | 0.1235 | - | - |
|
756 |
+
| 0.6430 | 2300 | 0.1245 | - | - |
|
757 |
+
| 0.6710 | 2400 | 0.1354 | - | - |
|
758 |
+
| 0.6989 | 2500 | 0.1217 | - | - |
|
759 |
+
| 0.7269 | 2600 | 0.1282 | - | - |
|
760 |
+
| 0.7548 | 2700 | 0.1326 | - | - |
|
761 |
+
| 0.7828 | 2800 | 0.1109 | - | - |
|
762 |
+
| 0.8107 | 2900 | 0.1165 | - | - |
|
763 |
+
| 0.8387 | 3000 | 0.1368 | - | - |
|
764 |
+
| 0.8666 | 3100 | 0.1174 | - | - |
|
765 |
+
| 0.8946 | 3200 | 0.1102 | - | - |
|
766 |
+
| 0.9226 | 3300 | 0.1151 | - | - |
|
767 |
+
| 0.9505 | 3400 | 0.1218 | - | - |
|
768 |
+
| 0.9785 | 3500 | 0.1109 | - | - |
|
769 |
+
| 1.0064 | 3600 | 0.1144 | - | - |
|
770 |
+
| 1.0344 | 3700 | 0.1148 | - | - |
|
771 |
+
| 1.0623 | 3800 | 0.1187 | - | - |
|
772 |
+
| 1.0903 | 3900 | 0.1126 | - | - |
|
773 |
+
| 1.1183 | 4000 | 0.1102 | 0.0833 | 0.9862 |
|
774 |
+
| 1.1462 | 4100 | 0.101 | - | - |
|
775 |
+
| 1.1742 | 4200 | 0.1137 | - | - |
|
776 |
+
| 1.2021 | 4300 | 0.0936 | - | - |
|
777 |
+
| 1.2301 | 4400 | 0.0889 | - | - |
|
778 |
+
| 1.2580 | 4500 | 0.0966 | - | - |
|
779 |
+
| 1.2860 | 4600 | 0.0803 | - | - |
|
780 |
+
| 1.3140 | 4700 | 0.0896 | - | - |
|
781 |
+
| 1.3419 | 4800 | 0.095 | - | - |
|
782 |
+
| 1.3699 | 4900 | 0.0979 | - | - |
|
783 |
+
| 1.3978 | 5000 | 0.0973 | - | - |
|
784 |
+
| 1.4258 | 5100 | 0.0911 | - | - |
|
785 |
+
| 1.4537 | 5200 | 0.1029 | - | - |
|
786 |
+
| 1.4817 | 5300 | 0.0914 | - | - |
|
787 |
+
| 1.5096 | 5400 | 0.0909 | - | - |
|
788 |
+
| 1.5376 | 5500 | 0.0923 | - | - |
|
789 |
+
| 1.5656 | 5600 | 0.0856 | - | - |
|
790 |
+
| 1.5935 | 5700 | 0.0849 | - | - |
|
791 |
+
| 1.6215 | 5800 | 0.0835 | - | - |
|
792 |
+
| 1.6494 | 5900 | 0.0957 | - | - |
|
793 |
+
| 1.6774 | 6000 | 0.0951 | 0.0768 | 0.9887 |
|
794 |
+
| 1.7053 | 6100 | 0.0818 | - | - |
|
795 |
+
| 1.7333 | 6200 | 0.099 | - | - |
|
796 |
+
| 1.7613 | 6300 | 0.0893 | - | - |
|
797 |
+
| 1.7892 | 6400 | 0.0897 | - | - |
|
798 |
+
| 1.8172 | 6500 | 0.0837 | - | - |
|
799 |
+
| 1.8451 | 6600 | 0.0993 | - | - |
|
800 |
+
| 1.8731 | 6700 | 0.0855 | - | - |
|
801 |
+
| 1.9010 | 6800 | 0.0852 | - | - |
|
802 |
+
| 1.9290 | 6900 | 0.0823 | - | - |
|
803 |
+
| 1.9569 | 7000 | 0.0869 | - | - |
|
804 |
+
| 1.9849 | 7100 | 0.0823 | - | - |
|
805 |
+
| 2.0129 | 7200 | 0.0851 | - | - |
|
806 |
+
| 2.0408 | 7300 | 0.0833 | - | - |
|
807 |
+
| 2.0688 | 7400 | 0.0873 | - | - |
|
808 |
+
| 2.0967 | 7500 | 0.0857 | - | - |
|
809 |
+
| 2.1247 | 7600 | 0.0828 | - | - |
|
810 |
+
| 2.1526 | 7700 | 0.0717 | - | - |
|
811 |
+
| 2.1806 | 7800 | 0.0967 | - | - |
|
812 |
+
| 2.2086 | 7900 | 0.0713 | - | - |
|
813 |
+
| 2.2365 | 8000 | 0.0782 | 0.0742 | 0.9882 |
|
814 |
+
| 2.2645 | 8100 | 0.0681 | - | - |
|
815 |
+
| 2.2924 | 8200 | 0.0689 | - | - |
|
816 |
+
| 2.3204 | 8300 | 0.0689 | - | - |
|
817 |
+
| 2.3483 | 8400 | 0.0753 | - | - |
|
818 |
+
| 2.3763 | 8500 | 0.0777 | - | - |
|
819 |
+
| 2.4042 | 8600 | 0.0805 | - | - |
|
820 |
+
| 2.4322 | 8700 | 0.0787 | - | - |
|
821 |
+
| 2.4602 | 8800 | 0.0731 | - | - |
|
822 |
+
| 2.4881 | 8900 | 0.0743 | - | - |
|
823 |
+
| 2.5161 | 9000 | 0.0735 | - | - |
|
824 |
+
| 2.5440 | 9100 | 0.074 | - | - |
|
825 |
+
| 2.5720 | 9200 | 0.0663 | - | - |
|
826 |
+
| 2.5999 | 9300 | 0.0706 | - | - |
|
827 |
+
| 2.6279 | 9400 | 0.0675 | - | - |
|
828 |
+
| 2.6559 | 9500 | 0.0796 | - | - |
|
829 |
+
| 2.6838 | 9600 | 0.074 | - | - |
|
830 |
+
| 2.7118 | 9700 | 0.0703 | - | - |
|
831 |
+
| 2.7397 | 9800 | 0.0746 | - | - |
|
832 |
+
| 2.7677 | 9900 | 0.0738 | - | - |
|
833 |
+
| 2.7956 | 10000 | 0.076 | 0.0714 | 0.9885 |
|
834 |
+
| 2.8236 | 10100 | 0.0681 | - | - |
|
835 |
+
| 2.8516 | 10200 | 0.0797 | - | - |
|
836 |
+
| 2.8795 | 10300 | 0.0678 | - | - |
|
837 |
+
| 2.9075 | 10400 | 0.0715 | - | - |
|
838 |
+
| 2.9354 | 10500 | 0.0733 | - | - |
|
839 |
+
| 2.9634 | 10600 | 0.0659 | - | - |
|
840 |
+
| 2.9913 | 10700 | 0.0687 | - | - |
|
841 |
+
|
842 |
+
</details>
|
843 |
+
|
844 |
### Framework Versions
|
845 |
+
- Python: 3.10.12
|
846 |
+
- Sentence Transformers: 3.2.0
|
847 |
+
- Transformers: 4.45.2
|
848 |
+
- PyTorch: 2.4.0+cu121
|
849 |
+
- Accelerate: 1.0.1
|
850 |
+
- Datasets: 3.0.2
|
851 |
+
- Tokenizers: 0.20.1
|
852 |
|
853 |
## Citation
|
854 |
|
855 |
### BibTeX
|
856 |
|
857 |
+
#### Sentence Transformers
|
858 |
+
```bibtex
|
859 |
+
@inproceedings{reimers-2019-sentence-bert,
|
860 |
+
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
|
861 |
+
author = "Reimers, Nils and Gurevych, Iryna",
|
862 |
+
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
|
863 |
+
month = "11",
|
864 |
+
year = "2019",
|
865 |
+
publisher = "Association for Computational Linguistics",
|
866 |
+
url = "https://arxiv.org/abs/1908.10084",
|
867 |
+
}
|
868 |
+
```
|
869 |
+
|
870 |
+
#### MultipleNegativesRankingLoss
|
871 |
+
```bibtex
|
872 |
+
@misc{henderson2017efficient,
|
873 |
+
title={Efficient Natural Language Response Suggestion for Smart Reply},
|
874 |
+
author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
|
875 |
+
year={2017},
|
876 |
+
eprint={1705.00652},
|
877 |
+
archivePrefix={arXiv},
|
878 |
+
primaryClass={cs.CL}
|
879 |
+
}
|
880 |
+
```
|
881 |
+
|
882 |
<!--
|
883 |
## Glossary
|
884 |
|
config.json
CHANGED
@@ -1,5 +1,5 @@
|
|
1 |
{
|
2 |
-
"_name_or_path": "/
|
3 |
"architectures": [
|
4 |
"XLMRobertaModel"
|
5 |
],
|
@@ -13,7 +13,7 @@
|
|
13 |
"initializer_range": 0.02,
|
14 |
"intermediate_size": 4096,
|
15 |
"layer_norm_eps": 1e-05,
|
16 |
-
"max_position_embeddings":
|
17 |
"model_type": "xlm-roberta",
|
18 |
"num_attention_heads": 16,
|
19 |
"num_hidden_layers": 24,
|
@@ -21,7 +21,7 @@
|
|
21 |
"pad_token_id": 1,
|
22 |
"position_embedding_type": "absolute",
|
23 |
"torch_dtype": "float32",
|
24 |
-
"transformers_version": "4.45.
|
25 |
"type_vocab_size": 1,
|
26 |
"use_cache": true,
|
27 |
"vocab_size": 250002
|
|
|
1 |
{
|
2 |
+
"_name_or_path": "intfloat/multilingual-e5-large-instruct",
|
3 |
"architectures": [
|
4 |
"XLMRobertaModel"
|
5 |
],
|
|
|
13 |
"initializer_range": 0.02,
|
14 |
"intermediate_size": 4096,
|
15 |
"layer_norm_eps": 1e-05,
|
16 |
+
"max_position_embeddings": 514,
|
17 |
"model_type": "xlm-roberta",
|
18 |
"num_attention_heads": 16,
|
19 |
"num_hidden_layers": 24,
|
|
|
21 |
"pad_token_id": 1,
|
22 |
"position_embedding_type": "absolute",
|
23 |
"torch_dtype": "float32",
|
24 |
+
"transformers_version": "4.45.2",
|
25 |
"type_vocab_size": 1,
|
26 |
"use_cache": true,
|
27 |
"vocab_size": 250002
|
config_sentence_transformers.json
CHANGED
@@ -1,8 +1,8 @@
|
|
1 |
{
|
2 |
"__version__": {
|
3 |
-
"sentence_transformers": "3.2.
|
4 |
-
"transformers": "4.45.
|
5 |
-
"pytorch": "2.4.0"
|
6 |
},
|
7 |
"prompts": {},
|
8 |
"default_prompt_name": null,
|
|
|
1 |
{
|
2 |
"__version__": {
|
3 |
+
"sentence_transformers": "3.2.0",
|
4 |
+
"transformers": "4.45.2",
|
5 |
+
"pytorch": "2.4.0+cu121"
|
6 |
},
|
7 |
"prompts": {},
|
8 |
"default_prompt_name": null,
|
model.safetensors
CHANGED
@@ -1,3 +1,3 @@
|
|
1 |
version https://git-lfs.github.com/spec/v1
|
2 |
-
oid sha256:
|
3 |
-
size
|
|
|
1 |
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:d0d642a915473631cdf27ac25ca63d7fdd75a3bc3ef6cac2202cbcd63043cf20
|
3 |
+
size 2239607176
|
modules.json
CHANGED
@@ -14,7 +14,25 @@
|
|
14 |
{
|
15 |
"idx": 2,
|
16 |
"name": "2",
|
17 |
-
"path": "
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
18 |
"type": "sentence_transformers.models.Normalize"
|
19 |
}
|
20 |
]
|
|
|
14 |
{
|
15 |
"idx": 2,
|
16 |
"name": "2",
|
17 |
+
"path": "2_Dense",
|
18 |
+
"type": "sentence_transformers.models.Dense"
|
19 |
+
},
|
20 |
+
{
|
21 |
+
"idx": 3,
|
22 |
+
"name": "3",
|
23 |
+
"path": "3_Dropout",
|
24 |
+
"type": "sentence_transformers.models.Dropout"
|
25 |
+
},
|
26 |
+
{
|
27 |
+
"idx": 4,
|
28 |
+
"name": "4",
|
29 |
+
"path": "4_Dense",
|
30 |
+
"type": "sentence_transformers.models.Dense"
|
31 |
+
},
|
32 |
+
{
|
33 |
+
"idx": 5,
|
34 |
+
"name": "5",
|
35 |
+
"path": "5_Normalize",
|
36 |
"type": "sentence_transformers.models.Normalize"
|
37 |
}
|
38 |
]
|
sentence_bert_config.json
CHANGED
@@ -1,4 +1,4 @@
|
|
1 |
{
|
2 |
-
"max_seq_length":
|
3 |
"do_lower_case": false
|
4 |
}
|
|
|
1 |
{
|
2 |
+
"max_seq_length": 512,
|
3 |
"do_lower_case": false
|
4 |
}
|
tokenizer.json
CHANGED
@@ -1,3 +1,3 @@
|
|
1 |
version https://git-lfs.github.com/spec/v1
|
2 |
-
oid sha256:
|
3 |
-
size
|
|
|
1 |
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:883b037111086fd4dfebbbc9b7cee11e1517b5e0c0514879478661440f137085
|
3 |
+
size 17082987
|
tokenizer_config.json
CHANGED
@@ -41,15 +41,15 @@
|
|
41 |
"special": true
|
42 |
}
|
43 |
},
|
|
|
44 |
"bos_token": "<s>",
|
45 |
"clean_up_tokenization_spaces": true,
|
46 |
"cls_token": "<s>",
|
47 |
"eos_token": "</s>",
|
48 |
"mask_token": "<mask>",
|
49 |
-
"model_max_length":
|
50 |
"pad_token": "<pad>",
|
51 |
"sep_token": "</s>",
|
52 |
-
"sp_model_kwargs": {},
|
53 |
"tokenizer_class": "XLMRobertaTokenizer",
|
54 |
"unk_token": "<unk>"
|
55 |
}
|
|
|
41 |
"special": true
|
42 |
}
|
43 |
},
|
44 |
+
"additional_special_tokens": [],
|
45 |
"bos_token": "<s>",
|
46 |
"clean_up_tokenization_spaces": true,
|
47 |
"cls_token": "<s>",
|
48 |
"eos_token": "</s>",
|
49 |
"mask_token": "<mask>",
|
50 |
+
"model_max_length": 512,
|
51 |
"pad_token": "<pad>",
|
52 |
"sep_token": "</s>",
|
|
|
53 |
"tokenizer_class": "XLMRobertaTokenizer",
|
54 |
"unk_token": "<unk>"
|
55 |
}
|