File size: 61,883 Bytes
a56a5e7 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 288 289 290 291 292 293 294 295 296 297 298 299 300 301 302 303 304 305 306 307 308 309 310 311 312 313 314 315 316 317 318 319 320 321 322 323 324 325 326 327 328 329 330 331 332 333 334 335 336 337 338 339 340 341 342 343 344 345 346 347 348 349 350 351 352 353 354 355 356 357 358 359 360 361 362 363 364 365 366 367 368 369 370 371 372 373 374 375 376 377 378 379 380 381 382 383 384 385 386 387 388 389 390 391 392 393 394 395 396 397 398 399 400 401 402 403 404 405 406 407 408 409 410 411 412 413 414 415 416 417 418 419 420 421 422 423 424 425 426 427 428 429 430 431 432 433 434 435 436 437 438 439 440 441 442 443 444 445 446 447 448 449 450 451 452 453 454 455 456 457 458 459 460 461 462 463 464 465 466 467 468 469 470 471 472 473 474 475 476 477 478 479 480 481 482 483 484 485 486 487 488 489 490 491 492 493 494 495 496 497 498 499 500 501 502 503 504 505 506 507 508 509 510 511 512 513 514 515 516 517 518 519 520 521 522 523 524 525 526 527 528 529 530 531 532 533 534 535 536 537 538 539 540 541 542 543 544 545 546 547 548 549 550 551 552 553 554 555 556 557 558 559 560 561 562 563 564 565 566 567 568 569 570 571 572 573 574 575 576 577 578 579 580 581 582 583 584 585 586 587 588 589 590 591 592 593 594 595 596 597 598 599 600 |
---
tags:
- sentence-transformers
- sentence-similarity
- feature-extraction
- generated_from_trainer
- dataset_size:3000
- loss:MultipleNegativesRankingLoss
base_model: answerdotai/ModernBERT-base
widget:
- source_sentence: pháp_luật quy_định như thế_nào về lưu_trữ và bảo_đảm tính toàn_vẹn
của chứng_từ điện_tử trong thực_hiện các chế_độ bảo_hiểm_thất_nghiệp ?
sentences:
- "a ) tổ_chức và thực_hiện xử_lý , phân_tích , tổng_hợp và cung_cấp thông_tin khoa_học\
\ và công_nghệ , thông_tin thống_kê khoa_học , công_nghệ và đổi_mới sáng_tạo phục_vụ\
\ lãnh_đạo , quản_lý , nghiên_cứu , đào_tạo , sản_xuất , kinh_doanh và phát_triển\
\ kinh_tế - xã_hội tại địa_phương ; \n b ) tổ_chức hướng_dẫn và triển_khai thực_hiện\
\ công_tác thu_thập , đăng_ký , lưu_giữ và công_bố thông_tin về nhiệm_vụ khoa_học\
\ và công_nghệ thuộc phạm_vi quản_lý của địa_phương theo quy_định ; \n c ) xây_dựng\
\ và phát_triển hạ_tầng thông_tin khoa_học và công_nghệ ; tham_gia xây_dựng ,\
\ cập_nhật và khai_thác cơ_sở dữ_liệu quốc_gia về khoa_học và công_nghệ ; xây_dựng\
\ , quản_lý , kết_nối và chia_sẻ các cơ_sở dữ_liệu về khoa_học và công_nghệ của\
\ địa_phương bảo_đảm việc tích_hợp , trao_đổi , chia_sẻ dữ_liệu đồng_bộ , thống_nhất\
\ ; tham_gia khai_thác , duy_trì và phát_triển mạng nghiên_cứu và đào_tạo việt_nam\
\ ( vinaren ) và các mạng thông_tin khoa_học và công_nghệ khác ; ứng_dụng công_nghệ\
\ thông_tin và truyền_thông , phương_tiện kỹ_thuật tiên_tiến trong hoạt_động thông_tin\
\ , thống_kê khoa_học và công_nghệ ; \n d ) đầu_mối kết_nối triển_khai các dự_án\
\ của hệ tri_thức việt_số hóa tại địa_phương ."
- "điều 19 . nghĩa_vụ của trung_tâm dịch_vụ_việc_làm khi tham_gia giao_dịch điện_tử\
\ trong lĩnh_vực bảo_hiểm xã_hội \n 1 . thực_hiện giao_dịch điện_tử trong giải_quyết\
\ các chế_độ bảo_hiểm_thất_nghiệp . \n 2 . cung_cấp danh_sách các quyết_định bảo_hiểm_thất_nghiệp\
\ , đối_tượng không đến khai_báo việc làm_hàng tháng , đối_tượng đăng_ký học nghề\
\ và tư_vấn giới_thiệu việc_làm , đối_tượng đến đăng_ký bảo_lưu bảo_hiểm_thất_nghiệp\
\ , không nhận quyết_định ( hủy quyết_định hưởng bảo_hiểm_thất_nghiệp ) bằng phương_tiện\
\ điện_tử . \n 3 . lưu_trữ và bảo_đảm tính toàn_vẹn của toàn_bộ chứng_từ điện_tử\
\ trong thực_hiện các chế_độ bảo_hiểm_thất_nghiệp ; thực_hiện các quy_định pháp_luật\
\ về bảo_đảm an_toàn , an_ninh hệ_thống dữ_liệu điện_tử . \n 4 . chấp_hành sự\
\ thanh_tra , kiểm_tra của các cơ_quan có thẩm_quyền theo quy_định của pháp_luật\
\ ."
- "khoản 1 . hàng năm , trước ngày 25 tháng 12 , bộ thông_tin và truyền_thông giao\
\ kế_hoạch cung_ứng dịch_vụ bưu_chính công_ích và dịch_vụ công_ích trong hoạt_động\
\ phát_hành báo_chí . nội_dung kế_hoạch bao_gồm : \n a ) sản_lượng các dịch_vụ\
\ bưu_chính công_ích quy_định tại khoản 1 , điều 2 thông_tư này . đơn_vị tính\
\ chỉ_tiêu kế_hoạch là cái ( thư ) ; \n b ) sản_lượng từng loại báo , tạp_chí\
\ theo quy_định tại điều 3 thông_tư này . đơn_vị tính chỉ_tiêu kế_hoạch là tờ\
\ ( báo ) , cuốn ( tạp_chí ) ; \n c ) chất_lượng dịch_vụ theo quy_chuẩn kỹ_thuật\
\ quốc_gia về chất_lượng dịch_vụ bưu_chính công_ích , dịch_vụ công_ích trong hoạt_động\
\ phát_hành báo_chí ; giá cước dịch_vụ theo quy_định của bộ thông_tin và truyền_thông\
\ ; \n d ) thời_gian thực_hiện kế_hoạch cung_ứng dịch_vụ : từ ngày 01 tháng 01\
\ đến hết ngày 31 tháng 12 của năm kế_hoạch ."
- source_sentence: loại tài_liệu nào được lưu_giữ trong hồ_sơ xử_lý đồ_vật cấm và
có phải là biên_bản bàn_giao hồ_sơ , tài_liệu có liên_quan không ?
sentences:
- "k ) biên_bản bàn_giao hồ_sơ , tài_liệu có liên_quan ( nếu chuyển cho các cơ_quan\
\ có thẩm_quyền giải_quyết theo quy_định ) ; \n l ) các tài_liệu khác có liên_quan\
\ . \n 2 . hồ_sơ xử_lý đồ_vật cấm đối_với trại_giam được lưu_giữ tại đội trinh_sát\
\ , đối_với trại tạm giam được lưu_giữ tại đội tham_mưu - hậu_cần ( những trại\
\ tạm giam có đội trinh_sát thì lưu_giữ tại đội trinh_sát ) nhà tạm giữ công_an\
\ cấp huyện được lưu_giữ tại đội cảnh_sát thi_hành án hình_sự và hỗ_trợ tư_pháp\
\ . việc bảo_quản và lưu_giữ hồ_sơ thực_hiện theo quy_định về chế_độ quản_lý hồ_sơ\
\ của bộ công_an ."
- "điều 26 . điều_kiện chào_bán trái_phiếu ra_công_chúng bằng đồng việt_nam của\
\ tổ_chức tài_chính_quốc_tế \n 1 . tổ_chức phát_hành là tổ_chức tài_chính_quốc_tế\
\ quy_định của pháp_luật về các tổ_chức tín_dụng mà nước cộng_hòa xã_hội chủ_nghĩa\
\ việt_nam là thành_viên . \n 2 . trái_phiếu chào_bán là trái_phiếu có kỳ_hạn\
\ không dưới 10 năm . \n 3 . có phương_án phát_hành và phương_án sử_dụng toàn_bộ\
\ số tiền huy_động được từ đợt chào_bán trái_phiếu ra_công_chúng cho các dự_án\
\ tại việt_nam được cấp có thẩm_quyền phê_duyệt theo quy_định của pháp_luật .\
\ \n 4 . tổng_số tiền huy_động từ đợt chào_bán tại việt_nam không vượt quá 30\
\ % tổng vốn đầu_tư của dự_án . \n 5 . có cam_kết thực_hiện nghĩa_vụ của tổ_chức\
\ phát_hành đối_với nhà đầu_tư về điều_kiện phát_hành , thanh_toán , bảo_đảm quyền\
\ và lợi_ích hợp_pháp của nhà đầu_tư và các điều_kiện khác . \n 6 . có cam_kết\
\ thực_hiện niêm_yết trái_phiếu trên hệ_thống giao_dịch chứng_khoán sau khi kết_thúc\
\ đợt chào_bán ."
- "điều 6 . điều_khoản thi_hành \n 1 . thông_tư này có hiệu_lực thi_hành từ ngày\
\ 01 tháng 8 năm 2022 và thay_thế thông_tư số 04 / 2011 / tt - nhnn ngày 10 tháng\
\ 3 năm 2011 của thống_đốc ngân_hàng nhà_nước việt_nam quy_định áp_dụng lãi_suất\
\ trong trường_hợp tổ_chức , cá_nhân rút_tiền gửi trước hạn tại tổ_chức tín_dụng\
\ . \n 2 . đối_với các thỏa_thuận lãi_suất rút trước hạn tiền gửi trước ngày thông_tư\
\ này có hiệu_lực thi_hành , tổ_chức tín_dụng và khách_hàng tiếp_tục thực_hiện\
\ theo thỏa_thuận đã cam_kết cho đến ngày đến hạn , ngày chi_trả hoặc ngày thanh_toán\
\ của khoản tiền gửi hoặc thỏa_thuận thực_hiện theo quy_định tại thông_tư này\
\ ."
- source_sentence: nếu một dự_án thuộc chương_trình nghiên_cứu , đào_tạo và xây_dựng
hạ_tầng kỹ_thuật công_nghệ_cao đã được phê_duyệt trước ngày 01 tháng 5 năm 2015
, thì nó sẽ được quản_lý theo quy_định nào ?
sentences:
- "trường_hợp phát_hiện khai sai , gian_lận , trốn_thuế thì phải bị xử_lý theo quy_định\
\ của pháp_luật về quản_lý thuế . \n 1.2 . địa_điểm nộp hồ_sơ_khai thuế : \n a\
\ ) đối_với hàng_hoá sản_xuất trong nước ( trừ than_đá tiêu_thụ nội_địa của tập_đoàn\
\ công_nghiệp than - khoáng_sản việt_nam và sản_xuất kinh_doanh xăng dầu ) , người\
\ nộp thuế bảo_vệ môi_trường thực_hiện nộp hồ_sơ_khai thuế bảo_vệ môi_trường với\
\ cơ_quan thuế quản_lý trực_tiếp . trường_hợp người nộp thuế có cơ_sở sản_xuất\
\ hàng_hoá chịu thuế bảo_vệ môi_trường tại tỉnh , thành_phố trực_thuộc trung_ương\
\ khác với trụ_sở chính thì nộp hồ_sơ_khai thuế bảo_vệ môi_trường với cơ_quan\
\ thuế quản_lý trực_tiếp tại địa_phương nơi có cơ_sở sản_xuất hàng_hoá chịu thuế\
\ bảo_vệ môi_trường . \n b ) đối_với hàng_hoá nhập_khẩu ( trừ trường_hợp xăng_dầu\
\ nhập_khẩu để bán ) , người nộp thuế nộp hồ_sơ_khai thuế với cơ_quan hải_quan\
\ nơi làm thủ_tục hải_quan . \n 1.3 . khai thuế bảo_vệ môi_trường :"
- "điều 20 . hiệu_lực thi_hành \n 1 . thông_tư này có hiệu_lực kể từ ngày 01 tháng\
\ 5 năm 2015 . thông_tư này thay_thế một_số quy_định liên_quan tổ_chức quản_lý\
\ các chương_trình được quy_định tại các thông_tư sau : \n a ) thông_tư số 02\
\ / 2012 / tt - bkhcn ngày 18 tháng 01 năm 2012 của bộ_trưởng bộ khoa_học và công_nghệ\
\ hướng_dẫn quản_lý chương_trình quốc_gia phát_triển công_nghệ_cao đến năm 2020\
\ ; \n b ) thông_tư số 31 / 2012 / tt - bkhcn ngày 28 tháng 12 năm 2012 của bộ_trưởng\
\ bộ khoa_học và công_nghệ hướng_dẫn_xác_định dự_án , tuyển_chọn , giao trực_tiếp\
\ tổ_chức , cá_nhân , doanh_nghiệp thực_hiện dự_án thuộc chương_trình nghiên_cứu\
\ , đào_tạo và xây_dựng hạ_tầng kỹ_thuật công_nghệ_cao ; \n c ) thông_tư 03 /\
\ 2013 / tt - bkhcn ngày 30 tháng 1 năm 2013 của bộ_trưởng bộ khoa_học và công_nghệ\
\ hướng_dẫn_xác_định , tuyển_chọn , thẩm_định và giao trực_tiếp thực_hiện nhiệm_vụ\
\ khoa_học và công_nghệ thuộc chương_trình đổi_mới công_nghệ quốc_gia đến năm\
\ 2020 ;"
- "khoản 3 . trách_nhiệm thực_hiện \n a ) ủy_ban nhân_dân các cấp có trách_nhiệm\
\ tuyên_truyền , phổ_biến kiến_thức , pháp_luật về phòng cháy và chữa_cháy rừng\
\ tại địa_phương theo quy_định của pháp_luật . \n b ) lực_lượng kiểm_lâm có trách_nhiệm\
\ hướng_dẫn , xây_dựng chương_trình , tuyên_truyền về phòng cháy và chữa_cháy\
\ rừng cho các tổ_chức , cá_nhân trên địa_bàn quản_lý . \n c ) người đứng đầu_cơ_quan\
\ , tổ_chức , cơ_sở có trách_nhiệm tổ_chức tuyên_truyền , phổ_biến kiến_thức ,\
\ pháp_luật về công_tác phòng cháy và chữa_cháy rừng cho cán_bộ , chiến_sĩ , công_nhân_viên\
\ , học_sinh , sinh_viên và quần_chúng nhân_dân ."
- source_sentence: pháp_luật quy_định pháp_nhân thương_mại có quyền nhận được biên_bản
mở niêm_phong tài_liệu , chứng_từ , thiết_bị chứa dữ_liệu điện_tử của mình không
?
sentences:
- khoản 3 . kết_thúc mở niêm_phong khi kết_thúc mở niêm_phong phải lập biên_bản
; biên_bản mở niêm_phong phải mô_tả đúng tình_trạng niêm_phong trước khi mở ,
thực_trạng của tài_liệu , chứng_từ , thiết_bị chứa dữ_liệu điện_tử , con_dấu của
pháp_nhân thương_mại sau khi mở niêm_phong và có đầy_đủ chữ_ký , họ tên hoặc điểm
chỉ ( kèm theo chú_thích họ tên của người điểm chỉ ) của người trực_tiếp chủ_trì
, người tham_gia mở niêm_phong . biên_bản do cơ_quan thi_hành án hình_sự có thẩm_quyền
thực_hiện mở niêm_phong lập thành 02 bản có giá_trị như nhau , 01 bản giao cho
người đại_diện theo pháp_luật của pháp_nhân thương_mại , 01 bản đưa vào hồ_sơ
thi_hành án . trường_hợp kiểm_tra niêm_phong không còn nguyên_vẹn , phải lập biên_bản
về tình_trạng niêm_phong tài_liệu , chứng_từ , thiết_bị chứa dữ_liệu điện_tử của
pháp_nhân thương_mại , thực_trạng của các tài_liệu , chứng_từ , thiết_bị chứa
dữ_liệu điện_tử , con_dấu của pháp_nhân thương_mại để xác_minh làm rõ và xử_lý
theo quy_định của pháp_luật .
- "c ) đưa kim tiêm đã nối sẵn với ống truyền thuốc vào tĩnh_mạch đã được xác_định\
\ theo quy_trình : bước 1 : tiêm thuốc làm mất tri_giác . sau khi tiêm thuốc xong\
\ , cán_bộ chuyên_môn thực_hiện thi_hành án tử_hình phải tiến_hành kiểm_tra ,\
\ nếu người bị thi_hành án tử_hình chưa mất tri_giác thì tiếp_tục tiêm thuốc cho\
\ đến khi họ mất tri_giác . bước 2 : tiêm thuốc làm liệt hệ vận_động . bước 3\
\ : tiêm thuốc làm ngừng hoạt_động của tim . \n d ) kiểm_tra hoạt_động tim của\
\ người bị thi_hành án tử_hình qua máy_điện tâm_đồ ."
- "điều 5 . kinh_phí in , phát_hành biểu_mẫu \n 1 . kinh_phí in , phát_hành biểu_mẫu\
\ sử_dụng trong công_tác cấp , quản_lý thẻ căn_cước công_dân , tàng_thư căn_cước\
\ công_dân và cơ_sở dữ_liệu quốc_gia về dân_cư được sử_dụng từ nguồn kinh_phí\
\ thường_xuyên của bộ công_an cấp cho công_an các đơn_vị , địa_phương . \n 2 .\
\ tổng_cục cảnh_sát chủ_trì , phối_hợp với cục tài_chính và các đơn_vị có liên_quan\
\ lập dự_trù kinh_phí in , phát_hành các biểu_mẫu và giấy in biểu_mẫu quy_định\
\ tại khoản 1 , khoản 2 điều 4 thông_tư này . tháng 9 hàng năm , công_an các đơn_vị\
\ , địa_phương lập dự_trù nhu_cầu sử_dụng biểu_mẫu cc02 , cc11 của đơn_vị , địa_phương\
\ mình cho năm tiếp_theo gửi cục cảnh_sát đăng_ký quản_lý cư_trú và dữ_liệu quốc_gia\
\ về dân_cư để tổng_hợp , báo_cáo tổng_cục cảnh_sát . \n 3 . công_an các đơn_vị\
\ , địa_phương lập dự_trù kinh_phí in , phát_hành biểu_mẫu sử_dụng trong công_tác\
\ cấp , quản_lý thẻ căn_cước công_dân , tàng_thư căn_cước công_dân và cơ_sở dữ_liệu\
\ quốc_gia về dân_cư quy_định tại khoản 3 , khoản 4 điều 4 thông_tư này ."
- source_sentence: bộ tài_chính quy_định thế_nào về người chủ sở_hữu thực hưởng của
khoản thu_nhập trong trường_hợp áp_dụng hiệp_định tránh đánh thuế hai lần ?
sentences:
- "khoản 2 . đối_với nguồn nhân_sự từ nơi khác : \n a ) cơ_quan đại_diện chủ sở_hữu\
\ trình thủ_tướng chính_phủ_phê_duyệt chủ_trương điều_động , bổ_nhiệm , đồng_thời\
\ gửi bộ nội_vụ để thẩm_định ; \n b ) bộ nội_vụ thẩm_định , trình thủ_tướng chính_phủ\
\ xem_xét , quyết_định về chủ_trương điều_động , bổ_nhiệm ; \n c ) chậm nhất sau\
\ 15 ngày kể từ ngày có văn_bản đồng_ý về chủ_trương điều_động , bổ_nhiệm của\
\ thủ_tướng chính_phủ , cơ_quan đại_diện chủ sở_hữu chủ_trì thực_hiện quy_trình\
\ bổ_nhiệm nhân_sự theo quy_định ; trường_hợp phát_sinh những vấn_đề khó_khăn\
\ , phức_tạp phải báo_cáo thủ_tướng chính_phủ ; \n d ) cơ_quan đại_diện chủ sở_hữu\
\ trình thủ_tướng chính_phủ , đồng_thời gửi tờ_trình và hồ_sơ bổ_nhiệm đến bộ\
\ nội_vụ để thẩm_định ; \n đ ) bộ nội_vụ thẩm_định , báo_cáo thủ_tướng chính_phủ\
\ xem_xét , quyết_định bổ_nhiệm , sau khi có ý_kiến thống_nhất của tập_thể ban\
\ cán_sự đảng chính_phủ ."
- "điều 51 . sử_dụng tiền ký_quỹ \n 1 . doanh_nghiệp bảo_hiểm , chi_nhánh nước_ngoài\
\ chỉ được sử_dụng tiền ký_quỹ để đáp_ứng các cam_kết đối_với bên mua bảo_hiểm\
\ khi khả_năng thanh_toán bị thiếu_hụt và phải được bộ tài_chính chấp_thuận bằng\
\ văn_bản . trong thời_hạn 90 ngày , kể từ ngày sử_dụng tiền ký_quỹ , doanh_nghiệp\
\ bảo_hiểm , chi_nhánh nước_ngoài có trách_nhiệm bổ_sung tiền ký_quỹ đã sử_dụng\
\ . \n 2 . doanh_nghiệp bảo_hiểm , chi_nhánh nước_ngoài được rút toàn_bộ tiền\
\ ký_quỹ khi chấm_dứt hoạt_động ."
- "3 . người đề_nghị áp_dụng hiệp_định không phải là người chủ sở_hữu thực hưởng\
\ của khoản thu_nhập mà số thuế liên_quan đến khoản thu_nhập đó được đề_nghị miễn\
\ , giảm theo hiệp_định . người chủ sở_hữu thực hưởng có_thể là một cá_nhân ,\
\ một công_ty hoặc một tổ_chức nhưng phải là đối_tượng có quyền sở_hữu và kiểm_soát\
\ đối_với thu_nhập , tài_sản , hoặc các quyền tạo ra thu_nhập . khi xem_xét để\
\ xác_định một đối_tượng là một người chủ sở_hữu thực hưởng , cơ_quan thuế sẽ\
\ xem_xét toàn_bộ các yếu_tố và hoàn_cảnh liên_quan đến đối_tượng đó trên cơ_sở\
\ nguyên_tắc “ bản_chất quyết_định hình_thức ” vì mục_tiêu của hiệp_định là tránh\
\ đánh thuế hai lần và ngăn_ngừa việc trốn lậu thuế . trong các trường_hợp sau\
\ đây , một đối_tượng sẽ không được coi là một người chủ sở_hữu thực hưởng : \n\
\ a ) khi người đề_nghị là một đối_tượng không cư_trú có nghĩa_vụ phân_phối hơn\
\ 50 % thu_nhập của mình cho một đối_tượng cư_trú của nước thứ ba trong phạm_vi\
\ 12 tháng kể từ khi nhận được thu_nhập ;"
pipeline_tag: sentence-similarity
library_name: sentence-transformers
metrics:
- cosine_accuracy
model-index:
- name: SentenceTransformer based on answerdotai/ModernBERT-base
results:
- task:
type: triplet
name: Triplet
dataset:
name: public administrative
type: public_administrative
metrics:
- type: cosine_accuracy
value: 0.981
name: Cosine Accuracy
---
# SentenceTransformer based on answerdotai/ModernBERT-base
This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [answerdotai/ModernBERT-base](https://huggingface.co/answerdotai/ModernBERT-base). It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
## Model Details
### Model Description
- **Model Type:** Sentence Transformer
- **Base model:** [answerdotai/ModernBERT-base](https://huggingface.co/answerdotai/ModernBERT-base) <!-- at revision 8949b909ec900327062f0ebf497f51aef5e6f0c8 -->
- **Maximum Sequence Length:** 8192 tokens
- **Output Dimensionality:** 768 dimensions
- **Similarity Function:** Cosine Similarity
<!-- - **Training Dataset:** Unknown -->
<!-- - **Language:** Unknown -->
<!-- - **License:** Unknown -->
### Model Sources
- **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
- **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
- **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
### Full Model Architecture
```
SentenceTransformer(
(0): Transformer({'max_seq_length': 8192, 'do_lower_case': False}) with Transformer model: ModernBertModel
(1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)
```
## Usage
### Direct Usage (Sentence Transformers)
First install the Sentence Transformers library:
```bash
pip install -U sentence-transformers
```
Then you can load this model and run inference.
```python
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("anhtuansh/ModernBERT-base-test-v2")
# Run inference
sentences = [
'bộ tài_chính quy_định thế_nào về người chủ sở_hữu thực hưởng của khoản thu_nhập trong trường_hợp áp_dụng hiệp_định tránh đánh thuế hai lần ?',
'3 . người đề_nghị áp_dụng hiệp_định không phải là người chủ sở_hữu thực hưởng của khoản thu_nhập mà số thuế liên_quan đến khoản thu_nhập đó được đề_nghị miễn , giảm theo hiệp_định . người chủ sở_hữu thực hưởng có_thể là một cá_nhân , một công_ty hoặc một tổ_chức nhưng phải là đối_tượng có quyền sở_hữu và kiểm_soát đối_với thu_nhập , tài_sản , hoặc các quyền tạo ra thu_nhập . khi xem_xét để xác_định một đối_tượng là một người chủ sở_hữu thực hưởng , cơ_quan thuế sẽ xem_xét toàn_bộ các yếu_tố và hoàn_cảnh liên_quan đến đối_tượng đó trên cơ_sở nguyên_tắc “ bản_chất quyết_định hình_thức ” vì mục_tiêu của hiệp_định là tránh đánh thuế hai lần và ngăn_ngừa việc trốn lậu thuế . trong các trường_hợp sau đây , một đối_tượng sẽ không được coi là một người chủ sở_hữu thực hưởng : \n a ) khi người đề_nghị là một đối_tượng không cư_trú có nghĩa_vụ phân_phối hơn 50 % thu_nhập của mình cho một đối_tượng cư_trú của nước thứ ba trong phạm_vi 12 tháng kể từ khi nhận được thu_nhập ;',
'điều 51 . sử_dụng tiền ký_quỹ \n 1 . doanh_nghiệp bảo_hiểm , chi_nhánh nước_ngoài chỉ được sử_dụng tiền ký_quỹ để đáp_ứng các cam_kết đối_với bên mua bảo_hiểm khi khả_năng thanh_toán bị thiếu_hụt và phải được bộ tài_chính chấp_thuận bằng văn_bản . trong thời_hạn 90 ngày , kể từ ngày sử_dụng tiền ký_quỹ , doanh_nghiệp bảo_hiểm , chi_nhánh nước_ngoài có trách_nhiệm bổ_sung tiền ký_quỹ đã sử_dụng . \n 2 . doanh_nghiệp bảo_hiểm , chi_nhánh nước_ngoài được rút toàn_bộ tiền ký_quỹ khi chấm_dứt hoạt_động .',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
```
<!--
### Direct Usage (Transformers)
<details><summary>Click to see the direct usage in Transformers</summary>
</details>
-->
<!--
### Downstream Usage (Sentence Transformers)
You can finetune this model on your own dataset.
<details><summary>Click to expand</summary>
</details>
-->
<!--
### Out-of-Scope Use
*List how the model may foreseeably be misused and address what users ought not to do with the model.*
-->
## Evaluation
### Metrics
#### Triplet
* Dataset: `public_administrative`
* Evaluated with [<code>TripletEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.TripletEvaluator)
| Metric | Value |
|:--------------------|:----------|
| **cosine_accuracy** | **0.981** |
<!--
## Bias, Risks and Limitations
*What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
-->
<!--
### Recommendations
*What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
-->
## Training Details
### Training Dataset
#### Unnamed Dataset
* Size: 3,000 training samples
* Columns: <code>query</code>, <code>positive</code>, and <code>negative</code>
* Approximate statistics based on the first 1000 samples:
| | query | positive | negative |
|:--------|:------------------------------------------------------------------------------------|:--------------------------------------------------------------------------------------|:--------------------------------------------------------------------------------------|
| type | string | string | string |
| details | <ul><li>min: 35 tokens</li><li>mean: 85.74 tokens</li><li>max: 225 tokens</li></ul> | <ul><li>min: 289 tokens</li><li>mean: 584.64 tokens</li><li>max: 923 tokens</li></ul> | <ul><li>min: 299 tokens</li><li>mean: 581.07 tokens</li><li>max: 929 tokens</li></ul> |
* Samples:
| query | positive | negative |
|:-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| <code>bộ tài_chính quy_định thế_nào về chi_phí cho cán_bộ , công_chức , viên_chức đi công_tác nước_ngoài để kiểm_tra tình_hình phát_triển của trẻ_em việt_nam được nhận làm con_nuôi ở nước_ngoài ?</code> | <code>c ) chi công_tác_phí cho cán_bộ , công_chức , viên_chức đi công_tác nước_ngoài để kiểm_tra tình_hình phát_triển của trẻ_em việt_nam được nhận làm con_nuôi ở nước_ngoài ( nếu có ) thực_hiện theo quy_định tại thông_tư số 102 / 2012 / tt - btc ngày 21 / 6 / 2012 của bộ tài_chính quy_định_chế_độ công_tác_phí cho cán_bộ , công_chức nhà_nước đi công_tác ngắn_hạn ở nước_ngoài do ngân_sách nhà_nước bảo_đảm kinh_phí ; <br> d ) chi tập_huấn nghiệp_vụ cho văn_phòng con_nuôi nước_ngoài tại việt_nam được thực_hiện theo quy_định tại thông_tư số 139 / 2010 / tt - btc ngày 21 / 9 / 2010 của bộ tài_chính quy_định việc lập dự_toán , quản_lý và sử_dụng kinh_phí từ ngân_sách nhà_nước dành cho công_tác đào_tạo , bồi_dưỡng cán_bộ , công_chức ;</code> | <code>điều 15 . nhiệm_vụ , quyền_hạn của bộ tài_chính <br> 1 . là cơ_quan đầu_mối giúp chính_phủ thống_nhất quản_lý nhà_nước về tài_sản công . <br> 2 . chủ_trì xây_dựng , trình cơ_quan , người có thẩm_quyền ban_hành_văn_bản quy_phạm_pháp_luật về : <br> a ) chế_độ quản_lý , sử_dụng tài_sản công tại cơ_quan , tổ_chức , đơn_vị ; việc phân_cấp thẩm_quyền quyết_định trong quản_lý , sử_dụng tài_sản công ; <br> b ) tiêu_chuẩn , định mức sử_dụng trụ_sở làm_việc , xe ô_tô , tài_sản công của cơ_quan đại_diện ngoại_giao , cơ_quan đại_diện lãnh_sự , cơ_quan đại_diện tại tổ_chức quốc_tế theo quy_định của pháp_luật về cơ_quan đại_diện của việt_nam ở nước_ngoài và cơ_quan , tổ_chức , đơn_vị khác của việt_nam ở nước_ngoài ( sau đây gọi là cơ_quan việt_nam ở nước_ngoài ) , máy_móc , thiết_bị và các tài_sản công được sử_dụng phổ_biến tại cơ_quan , tổ_chức , đơn_vị , trừ nhà ở công_vụ và tài_sản đặc_biệt tại đơn_vị lực_lượng vũ_trang nhân_dân ;</code> |
| <code>khi thuê đất để xây_dựng cơ_sở hạ_tầng , xây_dựng nhà để bán , giá đất được trừ để tính thuế giá_trị gia_tăng bao_gồm những chi_phí nào ?</code> | <code>a ) giá đất được trừ để tính thuế giá_trị gia_tăng được quy_định cụ_thể như sau : - trường_hợp được nhà_nước giao đất để đầu_tư cơ_sở hạ_tầng xây_dựng nhà để bán , giá đất được trừ để tính thuế giá_trị gia_tăng bao_gồm tiền_sử_dụng đất phải nộp ngân_sách nhà_nước ( không kể tiền_sử_dụng đất được miễn , giảm ) và chi_phí bồi_thường , giải_phóng mặt_bằng theo quy_định của pháp_luật ; - trường_hợp đấu_giá quyền sử_dụng đất thì giá đất được trừ để tính thuế giá_trị gia_tăng là giá đất trúng đấu_giá ; - trường_hợp thuê đất để xây_dựng cơ_sở hạ_tầng , xây_dựng nhà để bán , giá đất được trừ để tính thuế giá_trị gia_tăng là tiền thuê đất phải nộp ngân_sách nhà_nước ( không bao_gồm tiền thuê đất được miễn , giảm ) và chi_phí đền_bù , giải_phóng mặt_bằng theo quy_định của pháp_luật ; - trường_hợp cơ_sở kinh_doanh nhận chuyển_nhượng quyền sử_dụng đất của các tổ_chức , cá_nhân thì giá đất được trừ để tính thuế giá_trị gia_tăng là giá đất tại thời_điểm nhận chuyển_nhượng quyền sử_dụng đất bao_gồm c...</code> | <code>5 . phối_hợp với cơ_quan bảo_hiểm xã_hội trả sổ bảo_hiểm xã_hội cho người lao_động , xác_nhận thời_gian đóng bảo_hiểm xã_hội khi người lao_động chấm_dứt hợp_đồng lao_động , hợp_đồng làm_việc hoặc thôi_việc theo quy_định của pháp_luật . <br> 6 . cung_cấp chính_xác , đầy_đủ , kịp_thời thông_tin , tài_liệu liên_quan đến việc đóng , hưởng bảo_hiểm xã_hội theo yêu_cầu của cơ_quan quản_lý nhà_nước có thẩm_quyền , cơ_quan bảo_hiểm xã_hội . <br> 7 . định_kỳ 06 tháng , niêm_yết công_khai_thông_tin về việc đóng bảo_hiểm xã_hội cho người lao_động ; cung_cấp thông_tin về việc đóng bảo_hiểm xã_hội của người lao_động khi người lao_động hoặc tổ_chức công_đoàn yêu_cầu . <br> 8 . hằng năm , niêm_yết công_khai_thông_tin đóng bảo_hiểm xã_hội của người lao_động do cơ_quan bảo_hiểm xã_hội cung_cấp theo quy_định tại khoản 7 điều 23 của luật này . <br> điều 22 . quyền của cơ_quan bảo_hiểm xã_hội <br> 1 . tổ_chức quản_lý nhân_sự , tài_chính và tài_sản theo quy_định của pháp_luật . <br> 2 . từ_chối yêu_cầu trả bảo_hiểm xã_hội ,...</code> |
| <code>nếu tôi vừa có số tiền thuế đủ điều_kiện hoàn , vừa có số tiền thuế tiền chậm nộp , tiền phạt bị truy_thu thì cơ_quan thuế sẽ xử_lý như thế_nào ?</code> | <code>trường_hợp tại biên_bản kiểm_tra trước hoàn thuế xác_định người nộp thuế vừa có số tiền thuế đủ điều_kiện hoàn , vừa có số tiền thuế tiền chậm nộp , tiền phạt bị truy_thu thì cơ_quan thuế_ban_hành quyết_định xử_lý vi_phạm_pháp_luật về thuế và bù_trừ số tiền thuế được hoàn của người nộp thuế tại quyết_định hoàn thuế_kiêm bù_trừ thu ngân_sách nhà_nước theo mẫu_số 02 / qđ - ht ban_hành kèm theo phụ_lục i thông_tư này . <br> d ) đối_với hồ_sơ hoàn nộp thừa của người nộp thuế có khoản nộp thừa tại tỉnh nơi được hưởng khoản thu_phân_bổ , cơ_quan thuế quản_lý trực_tiếp chủ_trì tổng_hợp nghĩa_vụ thuế , số thuế đã nộp ngân_sách nhà_nước tại trụ_sở chính và các tỉnh nơi được hưởng khoản thu_phân_bổ .</code> | <code>điều 59 . quản_lý nhà_nước về kinh_doanh casino <br> 1 . chính_phủ thống_nhất quản_lý nhà_nước về kinh_doanh casino và ban_hành chính_sách điều_chỉnh hoạt_động_kinh_doanh casino theo thẩm_quyền . <br> 2 . thủ_tướng chính_phủ <br> a ) phê_duyệt chủ_trương , chính_sách , ban_hành các văn_bản quy_phạm_pháp_luật và biện_pháp cần_thiết theo thẩm_quyền để quản_lý hoạt_động_kinh_doanh casino theo quy_định tại nghị_định này và quy_định của pháp_luật có liên_quan ; <br> b ) chấp_thuận số_lượng máy trò_chơi , bàn trò_chơi và điều_chỉnh số_lượng máy trò_chơi , bàn trò_chơi tối_đa đối_với dự_án khu dịch_vụ , du_lịch và vui_chơi giải_trí tổng_hợp có casino theo quy_định tại điều 7 và điều 8 nghị_định này ; <br> c ) quyết_định các nội_dung khác có liên_quan đến hoạt_động_kinh_doanh casino theo thẩm_quyền quy_định tại nghị_định này và quy_định của pháp_luật . <br> 3 . bộ tài_chính chịu trách_nhiệm trước chính_phủ thực_hiện quản_lý nhà_nước về kinh_doanh casino , bao_gồm : <br> a ) nghiên_cứu , xây_dựng trình cấp có thẩm_...</code> |
* Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
```json
{
"scale": 20.0,
"similarity_fct": "cos_sim"
}
```
### Evaluation Dataset
#### Unnamed Dataset
* Size: 1,000 evaluation samples
* Columns: <code>query</code>, <code>positive</code>, and <code>negative</code>
* Approximate statistics based on the first 1000 samples:
| | query | positive | negative |
|:--------|:------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|:--------------------------------------------------------------------------------------|
| type | string | string | string |
| details | <ul><li>min: 37 tokens</li><li>mean: 85.51 tokens</li><li>max: 173 tokens</li></ul> | <ul><li>min: 297 tokens</li><li>mean: 587.0 tokens</li><li>max: 931 tokens</li></ul> | <ul><li>min: 276 tokens</li><li>mean: 585.64 tokens</li><li>max: 906 tokens</li></ul> |
* Samples:
| query | positive | negative |
|:----------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| <code>cục y_tế dự_phòng có vai_trò gì trong việc xây_dựng và phát_triển các kế_hoạch hoạt_động phối_hợp trong phòng , chống bệnh lây_truyền từ động_vật sang người ?</code> | <code>điều 13 . trách_nhiệm của cục y_tế dự_phòng - bộ y_tế <br> 1 . đầu_mối của bộ y_tế phối_hợp với cục thú_y - bộ nông_nghiệp và phát_triển nông_thôn triển_khai các hoạt_động phối_hợp phòng , chống bệnh lây_truyền từ động_vật sang người . <br> 2 . chỉ_đạo toàn_bộ các hoạt_động về phối_hợp giữa ngành y_tế và nông_nghiệp trong phòng , chống bệnh lây_truyền từ động_vật sang người đối_với các đơn_vị trong ngành y_tế . <br> 3 . phối_hợp với cục thú_y - bộ nông_nghiệp và phát_triển nông_thôn xây_dựng , đề_xuất sửa_đổi các hướng_dẫn giám_sát bệnh lây_truyền từ động_vật sang người ; xây_dựng và phát_triển các kế_hoạch hoạt_động phối_hợp trong phòng , chống bệnh lây_truyền từ động_vật sang người . <br> 4 . định_kỳ 6 tháng_một lần , tổ_chức họp giao_ban với cục thú_y - bộ nông_nghiệp và phát_triển nông_thôn và các đơn_vị liên_quan để đánh_giá hoạt_động phối_hợp trong giám_sát phòng , chống bệnh lây_truyền từ động_vật sang người .</code> | <code>khoản 1 . chi thường_xuyên : <br> a ) chi thanh_toán cá_nhân : tiền_lương , tiền công , phụ_cấp lương , các khoản đóng_góp theo lương ( bảo_hiểm xã_hội , bảo_hiểm y_tế , bảo_hiểm_thất_nghiệp ( nếu có ) , kinh_phí công_đoàn ) ; tiền khen_thưởng thành_tích theo danh_hiệu thi_đua và các khoản thanh_toán khác cho cá_nhân ; <br> b ) chi quản_lý hành_chính : chi thanh_toán dịch_vụ công_cộng ; vật_tư văn_phòng ; thông_tin tuyên_truyền , liên_lạc ; hội_nghị ; chi công_tác_phí ; chi thuê_mướn ; sửa_chữa , bảo_trì , bảo_dưỡng thường_xuyên tài_sản cố_định và các khoản chi hành_chính khác ; <br> c ) chi hoạt_động nghiệp_vụ : mua_sắm vật_tư , hàng_hóa dùng cho chuyên_môn , nghiệp_vụ ; thiết_bị an_toàn kho_quỹ , thiết_bị kiểm_đếm ; ấn chỉ các loại ; trang_phục , bảo_hộ lao_động ; các khoản nghiệp_vụ kiểm_đếm , đảo kho , điều_chuyển , bảo_vệ an_toàn kho , tiền , vàng_bạc , đá_quý , ngoại_tệ và các chứng_chỉ có_giá ; bảo_quản , lưu_trữ tài_liệu , chứng_từ ; các khoản nghiệp_vụ khác ; <br> d ) chi_phối_hợp tổ_chức...</code> |
| <code>theo quy_định , tay_vịn phải được lắp_đặt như thế_nào ở khu_vực cạnh cửa ra vào trên xe_khách thành_phố để người khuyết_tật tiếp_cận ?</code> | <code>trong bất_kỳ khu_vực nào không phải lối đi dọc mà hành_khách có_thể đứng : 2.3.4.1.3 . từ khu_vực cạnh cửa ra vào liền kề ngay cửa ra vào ưu_tiên đến ít_nhất một ghế ưu_tiên , tay_vịn có độ cao từ 800 mm đến 900 mm so với sàn xe ; hoặc ở khu_vực không phù_hợp với những yêu_cầu đó , tay_vịn không cần phải bố_trí liên_tục , nhưng khoảng trống giữa các tay_vịn không được lớn hơn 1050 mm , và phải có một tay_vịn thẳng_đứng bố_trí tại ít_nhất một phía của khoảng trống giữa các tay_vịn nói trên với chiều dài nằm trong khoảng từ độ cao 1200 mm đến độ cao không nhỏ hơn 1500 mm so với sàn xe . 2.3.4.1.4 . tay_vịn được bố_trí ở cả hai bên của khu_vực phía trong cửa vào hoặc cửa ra : 2.3.4.2 .</code> | <code>điều 15 . <br> 1 . hội_đồng quản_trị thực_hiện chức_năng quản_lý hoạt_động của tổng_công_ty , chịu trách_nhiệm về sự phát_triển của tổng_công_ty theo nhiệm_vụ nhà_nước giao . <br> 2 . hội_đồng quản_trị có các quyền_hạn và nhiệm_vụ sau : <br> a ) nhận vốn ( kể_cả nợ ) , đất_đai , tài_nguyên và các nguồn_lực khác do nhà_nước giao cho tổng_công_ty . <br> b ) xem_xét , phê_duyệt phương_án do tổng_giám_đốc đề_nghị về việc phân giao vốn và các nguồn_lực khác cho các đơn_vị thành_viên và phương_án điều_hoà_vốn và các nguồn_lực khác giữa các đơn_vị thành_viên ; kiểm_tra , giám_sát việc thực_hiện các phương_án đó ; <br> c ) kiểm_tra , giám_sát mọi hoạt_động trong tổng_công_ty ; trong đó có việc sử_dụng , bảo_toàn , phát_triển vốn và các nguồn_lực được giao ; việc thực_hiện các nghị_định và quyết_định của hội_đồng quản_trị , các quy_định của luật_pháp ; việc thực_hiện nghĩa_vụ đối_với nhà_nước .</code> |
| <code>ngày 01 tháng 01 năm 2018 có ý_nghĩa gì đối_với nghị_định về trình_tự , thủ_tục , mức tiền pháp_nhân thương_mại phải nộp để bảo_đảm thi_hành án ?</code> | <code>chương iv. điều_khoản thi_hành <br> điều 10 . hiệu_lực thi_hành . nghị_định này có hiệu_lực thi_hành từ ngày 01 tháng 01 năm 2018 . <br> điều 11 . trách_nhiệm thi_hành . các bộ_trưởng , thủ_trưởng cơ_quan ngang bộ , thủ_trưởng cơ_quan thuộc chính_phủ , chủ_tịch ủy_ban nhân_dân các tỉnh , thành_phố trực_thuộc trung_ương và các đối_tượng áp_dụng của nghị_định chịu trách_nhiệm thi_hành nghị_định này . / nơi nhận : - ban bí_thư trung_ương đảng ; - thủ_tướng , các phó_thủ_tướng chính_phủ ; - các bộ , cơ_quan ngang bộ , cơ_quan thuộc chính_phủ ; - hđnd , ubnd các tỉnh , thành_phố trực_thuộc trung_ương ; - văn_phòng trung_ương và các ban của đảng ; - văn_phòng tổng_bí_thư ; - văn_phòng chủ_tịch nước ; - hội_đồng dân_tộc và các ủy_ban của quốc_hội ; - văn_phòng quốc_hội ; - tòa_án nhân_dân tối_cao ; - viện kiểm_sát_nhân_dân tối_cao ; - kiểm_toán nhà_nước ; - ủy_ban giám_sát tài_chính quốc_gia ; - ngân_hàng chính_sách xã_hội ; - ngân_hàng phát_triển việt_nam ;</code> | <code>viên_chức đăng_ký dự_thi thăng_hạng được miễn thi môn ngoại_ngữ , tin_học theo quy_định tại khoản 6 và khoản 7 điều 39 nghị_định số 115 / 2020 / nđ - cp. viên_chức đăng_ký dự_xét thăng_hạng thuộc đối_tượng được miễn thi môn ngoại_ngữ , tin_học theo quy_định tại khoản 6 và khoản 7 điều 39 nghị_định số 115 / 2020 / nđ - cp được xác_nhận đáp_ứng tiêu_chuẩn về ngoại_ngữ , tin_học khi đăng_ký dự_xét thăng_hạng . trường_hợp không thuộc đối_tượng miễn thi môn ngoại_ngữ , tin_học theo quy_định tại khoản 6 và khoản 7 điều 39 nghị_định số 115 / 2020 / nđ - cp thì trong hồ_sơ dự xét phải có minh chứng đáp_ứng yêu_cầu về tiêu_chuẩn ngoại_ngữ , tin_học của chức_danh nghề_nghiệp đăng_ký dự_xét thăng_hạng .</code> |
* Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
```json
{
"scale": 20.0,
"similarity_fct": "cos_sim"
}
```
### Training Hyperparameters
#### Non-Default Hyperparameters
- `per_device_train_batch_size`: 2
- `per_device_eval_batch_size`: 2
- `learning_rate`: 2e-05
- `num_train_epochs`: 2
- `warmup_ratio`: 0.05
- `bf16`: True
- `batch_sampler`: no_duplicates
#### All Hyperparameters
<details><summary>Click to expand</summary>
- `overwrite_output_dir`: False
- `do_predict`: False
- `eval_strategy`: no
- `prediction_loss_only`: True
- `per_device_train_batch_size`: 2
- `per_device_eval_batch_size`: 2
- `per_gpu_train_batch_size`: None
- `per_gpu_eval_batch_size`: None
- `gradient_accumulation_steps`: 1
- `eval_accumulation_steps`: None
- `torch_empty_cache_steps`: None
- `learning_rate`: 2e-05
- `weight_decay`: 0.0
- `adam_beta1`: 0.9
- `adam_beta2`: 0.999
- `adam_epsilon`: 1e-08
- `max_grad_norm`: 1.0
- `num_train_epochs`: 2
- `max_steps`: -1
- `lr_scheduler_type`: linear
- `lr_scheduler_kwargs`: {}
- `warmup_ratio`: 0.05
- `warmup_steps`: 0
- `log_level`: passive
- `log_level_replica`: warning
- `log_on_each_node`: True
- `logging_nan_inf_filter`: True
- `save_safetensors`: True
- `save_on_each_node`: False
- `save_only_model`: False
- `restore_callback_states_from_checkpoint`: False
- `no_cuda`: False
- `use_cpu`: False
- `use_mps_device`: False
- `seed`: 42
- `data_seed`: None
- `jit_mode_eval`: False
- `use_ipex`: False
- `bf16`: True
- `fp16`: False
- `fp16_opt_level`: O1
- `half_precision_backend`: auto
- `bf16_full_eval`: False
- `fp16_full_eval`: False
- `tf32`: None
- `local_rank`: 0
- `ddp_backend`: None
- `tpu_num_cores`: None
- `tpu_metrics_debug`: False
- `debug`: []
- `dataloader_drop_last`: False
- `dataloader_num_workers`: 0
- `dataloader_prefetch_factor`: None
- `past_index`: -1
- `disable_tqdm`: False
- `remove_unused_columns`: True
- `label_names`: None
- `load_best_model_at_end`: False
- `ignore_data_skip`: False
- `fsdp`: []
- `fsdp_min_num_params`: 0
- `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
- `fsdp_transformer_layer_cls_to_wrap`: None
- `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
- `deepspeed`: None
- `label_smoothing_factor`: 0.0
- `optim`: adamw_torch
- `optim_args`: None
- `adafactor`: False
- `group_by_length`: False
- `length_column_name`: length
- `ddp_find_unused_parameters`: None
- `ddp_bucket_cap_mb`: None
- `ddp_broadcast_buffers`: False
- `dataloader_pin_memory`: True
- `dataloader_persistent_workers`: False
- `skip_memory_metrics`: True
- `use_legacy_prediction_loop`: False
- `push_to_hub`: False
- `resume_from_checkpoint`: None
- `hub_model_id`: None
- `hub_strategy`: every_save
- `hub_private_repo`: None
- `hub_always_push`: False
- `gradient_checkpointing`: False
- `gradient_checkpointing_kwargs`: None
- `include_inputs_for_metrics`: False
- `include_for_metrics`: []
- `eval_do_concat_batches`: True
- `fp16_backend`: auto
- `push_to_hub_model_id`: None
- `push_to_hub_organization`: None
- `mp_parameters`:
- `auto_find_batch_size`: False
- `full_determinism`: False
- `torchdynamo`: None
- `ray_scope`: last
- `ddp_timeout`: 1800
- `torch_compile`: False
- `torch_compile_backend`: None
- `torch_compile_mode`: None
- `dispatch_batches`: None
- `split_batches`: None
- `include_tokens_per_second`: False
- `include_num_input_tokens_seen`: False
- `neftune_noise_alpha`: None
- `optim_target_modules`: None
- `batch_eval_metrics`: False
- `eval_on_start`: False
- `use_liger_kernel`: False
- `eval_use_gather_object`: False
- `average_tokens_across_devices`: False
- `prompts`: None
- `batch_sampler`: no_duplicates
- `multi_dataset_batch_sampler`: proportional
</details>
### Training Logs
| Epoch | Step | Training Loss | public_administrative_cosine_accuracy |
|:------:|:----:|:-------------:|:-------------------------------------:|
| 0 | 0 | - | 0.565 |
| 0.0667 | 100 | 1.1879 | - |
| 0.1333 | 200 | 0.6573 | - |
| 0.2 | 300 | 0.5475 | - |
| 0.2667 | 400 | 0.4957 | - |
| 0.3333 | 500 | 0.3567 | - |
| 0.4 | 600 | 0.3928 | - |
| 0.4667 | 700 | 0.36 | - |
| 0.5333 | 800 | 0.3773 | - |
| 0.6 | 900 | 0.2408 | - |
| 0.6667 | 1000 | 0.2237 | - |
| 0.7333 | 1100 | 0.2253 | - |
| 0.8 | 1200 | 0.1844 | - |
| 0.8667 | 1300 | 0.1477 | - |
| 0.9333 | 1400 | 0.1033 | - |
| 1.0 | 1500 | 0.1474 | - |
| 1.0667 | 1600 | 0.1485 | - |
| 1.1333 | 1700 | 0.0516 | - |
| 1.2 | 1800 | 0.1071 | - |
| 1.2667 | 1900 | 0.0663 | - |
| 1.3333 | 2000 | 0.0467 | - |
| 1.4 | 2100 | 0.0596 | - |
| 1.4667 | 2200 | 0.073 | - |
| 1.5333 | 2300 | 0.0452 | - |
| 1.6 | 2400 | 0.022 | - |
| 1.6667 | 2500 | 0.0254 | - |
| 1.7333 | 2600 | 0.0392 | - |
| 1.8 | 2700 | 0.0114 | - |
| 1.8667 | 2800 | 0.0101 | - |
| 1.9333 | 2900 | 0.0072 | - |
| 2.0 | 3000 | 0.0065 | 0.981 |
### Framework Versions
- Python: 3.11.11
- Sentence Transformers: 3.3.1
- Transformers: 4.49.0.dev0
- PyTorch: 2.5.1+cu121
- Accelerate: 1.2.1
- Datasets: 3.2.0
- Tokenizers: 0.21.0
## Citation
### BibTeX
#### Sentence Transformers
```bibtex
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
```
#### MultipleNegativesRankingLoss
```bibtex
@misc{henderson2017efficient,
title={Efficient Natural Language Response Suggestion for Smart Reply},
author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
year={2017},
eprint={1705.00652},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
```
<!--
## Glossary
*Clearly define terms in order to be accessible across audiences.*
-->
<!--
## Model Card Authors
*Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
-->
<!--
## Model Card Contact
*Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
--> |