YuITC commited on
Commit
ce323ef
·
verified ·
1 Parent(s): 2cc0c38

Test upload 1

Browse files
1_Pooling/config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "word_embedding_dimension": 768,
3
+ "pooling_mode_cls_token": false,
4
+ "pooling_mode_mean_tokens": true,
5
+ "pooling_mode_max_tokens": false,
6
+ "pooling_mode_mean_sqrt_len_tokens": false,
7
+ "pooling_mode_weightedmean_tokens": false,
8
+ "pooling_mode_lasttoken": false,
9
+ "include_prompt": true
10
+ }
README.md CHANGED
@@ -1,3 +1,834 @@
1
  ---
 
 
2
  license: mit
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
3
  ---
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
  ---
2
+ language:
3
+ - vi
4
  license: mit
5
+ tags:
6
+ - sentence-transformers
7
+ - sentence-similarity
8
+ - feature-extraction
9
+ - generated_from_trainer
10
+ - dataset_size:99580
11
+ - loss:CachedMultipleNegativesRankingLoss
12
+ base_model: google-bert/bert-base-multilingual-cased
13
+ widget:
14
+ - source_sentence: Chi cục Hàng hải Việt Nam có thực hiện cấp giấy chứng nhận hội
15
+ phí tham gia Tổ chức Hàng hải Quốc tế?
16
+ sentences:
17
+ - 'Tiêu hủy tài liệu, vật chứa bí mật nhà nước
18
+
19
+ 1. Các trường hợp tiến hành thực hiện việc tiêu hủy tài liệu, vật chứa bí mật
20
+ nhà nước gồm:
21
+
22
+ a) Khi không cần thiết phải lưu giữ và việc tiêu hủy không gây nguy hại đến lợi
23
+ ích quốc gia, dân tộc.
24
+
25
+ b) Nếu không tiêu hủy ngày sẽ gây nguy hại cho lợi ích quốc gia, dân tộc.
26
+
27
+ ...'
28
+ - '"Điều 4. Nội dung và mức chi chi phí cưỡng chế
29
+
30
+ 1. Việc xác định chi phí cưỡng chế thực hiện theo quy định tại Điều 39 Nghị định
31
+ số 166/2013/NĐ-CP, bao gồm các chi phí sau:
32
+
33
+ a) Chi phí huy động người thực hiện quyết định cưỡng chế: chi phí bồi dưỡng cho
34
+ những người trực tiếp thực hiện cưỡng chế và bảo vệ cưỡng chế;
35
+
36
+ b) Chi phí thuê phương tiện tháo dỡ, chuyên chở đồ vật, tài sản;
37
+
38
+ c) Chi phí thuê giữ hoặc bảo quản tài sản kê biên;
39
+
40
+ d) Chi phí thù lao cho các chuyên gia tham gia định giá để tổ chức đấu giá theo
41
+ quy định của pháp luật;
42
+
43
+ đ) Chi phí tổ chức bán đấu giá tài sản:
44
+
45
+ - Chi phí bán đấu giá theo quy định của pháp luật trong trường hợp người ra quyết
46
+ định cưỡng chế ký hợp đồng bán đấu giá với tổ chức bán đấu giá chuyên nghiệp trên
47
+ địa bàn tỉnh, thành phố trực thuộc Trung ương nơi có tài sản bị kê biên để bán
48
+ đấu giá;
49
+
50
+ - Tiền thuê địa điểm, phương tiện phục vụ tổ chức bán đấu giá, niêm yết, công
51
+ khai việc bán đấu giá trường hợp thành lập Hội đồng bán đấu giá tài sản.
52
+
53
+ e) Chi phí thực tế khác liên quan đến thực hiện cưỡng chế (nếu có).
54
+
55
+ 2. Mức chi:
56
+
57
+ a) Chi bồi dưỡng cho những người được huy động trực tiếp tham gia cưỡng chế và
58
+ bảo vệ cưỡng chế:
59
+
60
+ - Cán bộ, công chức của cơ quan thi hành quyết định cưỡng chế được huy động thực
61
+ hiện cưỡng chế, lực lượng công an, dân quân tự vệ, đại diện chính quyền địa phương
62
+ trực tiếp tham gia cưỡng chế: người chủ trì mức 150.000 đồng/người/ngày tham gia
63
+ cưỡng chế, đối tượng khác mức 100.000 đồng/người/ngày tham gia cưỡng chế.
64
+
65
+ - Đại diện tổ dân phố, trưởng thôn và các đối tượng khác được người ra quyết định
66
+ cưỡng chế huy động tham gia cưỡng chế: 100.000 đồng/người/ngày tham gia cưỡng
67
+ chế.
68
+
69
+ b) Các chi phí quy định tại điểm b, c, d, đ, e khoản 1 Điều này được thực hiện
70
+ căn cứ vào hợp đồng, thanh lý hợp đồng, biên bản bàn giao tài sản kê biên (đối
71
+ với chi phí bảo quản tài sản kê biên quy định tại điểm c khoản 1 Điều này), hóa
72
+ đơn, chứng từ chi tiêu thực tế, hợp pháp, hợp lệ theo quy định hiện hành, phù
73
+ hợp với giá cả trên địa bàn trong cùng thời kỳ và được người ra quyết định cưỡng
74
+ chế phê duyệt."'
75
+ - 'Nhiệm vụ và quyền hạn
76
+
77
+ 1. Thực hiện đăng ký thuyền viên, đăng ký tàu biển, xóa đăng ký tàu biển, cấp
78
+ các giấy tờ, tài liệu liên quan đến thuyền viên và tàu biển theo quy định của
79
+ pháp luật.
80
+
81
+ 2. Thực hiện thu và cấp giấy chứng nhận Hội phí IMO theo quy định.
82
+
83
+ 3. Tham gia xây dựng chiến lược, quy hoạch, kế hoạch dài hạn và hàng năm, các
84
+ chương trình dự án quốc gia, các đề án phát triển thuộc ngành hàng hải.
85
+
86
+ 4. Tham gia xây dựng, tổ chức thực hiện các văn bản quy phạm pháp luật và tham
87
+ gia tổ chức tuyên truyền, phổ biến pháp luật về hàng hải đối với các tổ chức,
88
+ đơn vị, cá nhân hoạt động trong lĩnh vực hàng hải.
89
+
90
+ 5. Tham gia giám sát việc thực hiện niêm yết giá, phụ thu ngoài giá dịch vụ vận
91
+ chuyển hàng hóa công - te - nơ bằng đường biển, giá dịch vụ tại cảng biển theo
92
+ quy định.
93
+
94
+ 6. Phê duyệt phương án vận tải hàng hóa siêu trường hoặc hàng hóa siêu trọng đối
95
+ với phương tiện thủy nội địa rời bến cảng biển theo quy định.
96
+
97
+ 7. Về tổ chức quản lý đầu tư xây dựng, khai thác cảng cạn
98
+
99
+ a) Tổ chức kiểm tra, giám sát việc thực hiện quy hoạch, đầu tư xây dựng, khai
100
+ thác đối với cảng cạn được giao theo quy định;
101
+
102
+ b) Tham gia thẩm định việc chuyển đổi điểm thông quan hàng hóa xuất, nhập khẩu
103
+ thành cảng cạn theo quy định của pháp luật.
104
+
105
+ 8. Tham mưu, đề xuất các giải pháp tăng cường kết nối các phương thức vận tải
106
+ với cảng biển.
107
+
108
+ 9. Thực hiện cấp mới, cấp lại và thu hồi giấy xác nhận phù hợp về tuyển dụng và
109
+ cung ứng thuyền viên theo quy định của pháp luật.
110
+
111
+ 10. Phối hợp với các Hiệp hội chuyên ngành thực hiện phân tích, đánh giá tình
112
+ hình hoạt động chuyên ngành hàng hải tại khu vực, đề xuất cơ chế chính sách tạo
113
+ điều kiện thuận lợi cho doanh nghiệp và giải pháp quản lý nhà nước về nâng cao
114
+ chất lượng các loại hình dịch vụ nhằm tăng cường vai trò quản lý nhà nước của
115
+ Cục Hàng hải Việt Nam.
116
+
117
+ 11. Phối hợp tổ chức đối thoại với doanh nghiệp về khó khăn, vướng mắc trong thực
118
+ hiện quy định, thủ tục hành chính liên quan đến hoạt động sản xuất, kinh doanh,
119
+ đầu tư, thuyền viên, tàu biển, vận tải biển nhằm tạo điều kiện thuận lợi cho các
120
+ doanh nghiệp hoạt động trong lĩnh vực hàng hải tại khu vực.
121
+
122
+ ...'
123
+ - source_sentence: Kết quả kiểm tra, xác minh tại cơ quan, tổ chức cấp chứng từ chứng
124
+ nhận xuất xứ hàng hóa, cơ sở sản xuất hàng hóa xuất khẩu sẽ được xử lý như thế
125
+ nào?
126
+ sentences:
127
+ - 'Mức phạt tiền và thẩm quyền phạt tiền trong lĩnh vực du lịch
128
+
129
+ 1. Mức phạt tiền tối đa đối với mỗi hành vi vi phạm hành chính trong lĩnh vực
130
+ du lịch đối với cá nhân là 50.000.000 đồng, đối với tổ chức là 100.000.000 đồng.
131
+
132
+ 2. Mức phạt tiền quy định tại các Điều 6, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17
133
+ và 18 Nghị định này là áp dụng đối với cá nhân. Mức phạt tiền quy định tại Điều
134
+ 7 Nghị định này là áp dụng đối với tổ chức.
135
+
136
+ 3. Đối với cùng một hành vi vi phạm hành chính thì mức phạt tiền đối với tổ chức
137
+ gấp 02 lần mức phạt tiền đối với cá nhân.
138
+
139
+ 4. Thẩm quyền phạt tiền của các chức danh có thẩm quyền xử phạt quy định tại Chương
140
+ III Nghị định này là thẩm quyền áp dụng đối với hành vi vi phạm hành chính của
141
+ cá nhân; thẩm quyền phạt tiền với tổ chức gấp 02 lần thẩm quyền phạt tiền đối
142
+ với cá nhân.'
143
+ - '"Điều 11. Yêu cầu đối với dịch vụ công trực tuyến
144
+
145
+ 1. Các mục hướng dẫn tối thiểu phục vụ việc cung cấp dịch vụ công trực tuyến trên
146
+ cổng thông tin điện tử bao gồm:
147
+
148
+ a) Mục hướng dẫn thực hiện đối với việc thực hiện một số dịch vụ hành chính công
149
+ thường gặp để giúp người sử dụng biết được các thủ tục, các bước tiến hành khi
150
+ muốn thực hiện một công việc;
151
+
152
+ b) Mục các câu hỏi trường gặp và nội dung trả lời để giúp người sử dụng có thể
153
+ tự tìm ra giải đáp được các vướng mắc thông thường khi thực hiện thủ tục hành
154
+ chính, khi sử dụng dịch vụ công trực tuyến.
155
+
156
+ 2. Dịch vụ công trực tuyến mức độ 3, mức độ 4 cần đạt được các yêu cầu tối thiểu
157
+ như sau:
158
+
159
+ a) Phải tương thích với các trình duyệt Web thông dụng;
160
+
161
+ b) Dễ dàng tìm thấy dịch vụ: người sử dụng dễ dàng tìm được dịch vụ sau tối đa
162
+ 03 lần bấm chuột từ trang chủ của cổng thông tin điện tử cung cấp dịch vụ công
163
+ trực tuyến; dễ dàng tìm được dịch vụ bằng các công cụ tìm kiếm phổ biến;
164
+
165
+ c) Có cơ chế hướng dẫn, tự động khai báo thông tin: hỗ trợ tự động điền các thông
166
+ tin của người sử dụng nếu các thông tin đó đã được người sử dụng cung cấp khi
167
+ đăng ký tài khoản hoặc trong lần sử dụng dịch vụ trước, thông tin của cơ quan
168
+ nhà nước đã có trong cơ sở dữ liệu của hệ thống dịch vụ công trực tuyến; hỗ trợ
169
+ việc điền, kiểm tra thông tin theo các định dạng quy định sẵn; có giải thích chi
170
+ tiết về thông tin cần nhập (đối với các thông tin có yêu cầu riêng, mang tính
171
+ chất chuyên ngành);
172
+
173
+ d) Có chức năng để người sử dụng đánh giá sự hài lòng đối với dịch vụ sau khi
174
+ sử dụng (sau đây gọi tắt là chức năng đánh giá);
175
+
176
+ đ) Bảo đảm thời gian xử lý, trao đổi dữ liệu nhanh: trong trường hợp hệ thống
177
+ biết rõ thời gian xử lý, trao đổi dữ liệu lâu hơn 10 giây cần cung cấp thông báo
178
+ thể hiện tỷ lệ phần trăm hoàn thành việc xử lý;
179
+
180
+ e) Bảo đảm hoạt động ổn định: các dịch vụ công trực tuyến phải hoạt động liên
181
+ tục 24 giờ trong tất cả các ngày; bảo đảm dịch vụ được kiểm tra lỗi đầy đủ trước
182
+ khi đưa vào sử dụng để hạn chế tối đa lỗi phát sinh trong quá trình sử dụng; khi
183
+ bảo trì, nâng cấp dịch vụ cần thông báo thông tin về việc bảo trì, nâng cấp và
184
+ thời gian dự kiến hoạt động trở lại trên cổng thông tin điện tử cung cấp dịch
185
+ vụ công trực tuyến trước ít nhất 01 ngày làm việc;
186
+
187
+ g) Có địa chỉ thư điện tử để tiếp nhận góp ý của người sử dụng.
188
+
189
+ 3. Cổng thông tin điện tử cung cấp dịch vụ công trực tuyến phải có chức năng thống
190
+ kê kết quả giải quyết hồ sơ của các dịch vụ công trực tuyến mức độ 3, mức độ 4.
191
+ Mỗi dịch vụ phải thông báo các số liệu thống kê tối thiểu từ đầu năm tới thời
192
+ điểm hiện tại như sau:
193
+
194
+ a) Số lượng hồ sơ trực tuyến đã tiếp nhận;
195
+
196
+ b) Số lượng hồ sơ trực tuyến đã giải quyết;
197
+
198
+ c) Tỉ lệ hồ sơ trực tuyến được giải quyết đúng hạn;
199
+
200
+ d) Tổng số hồ sơ đã tiếp nhận qua hình thức trực tuyến và không trực tuyến;
201
+
202
+ đ) Số liệu về mức độ hài lòng của người sử dụng đối với dịch vụ theo từng nội
203
+ dung đánh giá quy định tại Điều 12 Thông tư này."'
204
+ - 'Xử lý kết quả kiểm tra, xác minh tại cơ quan, tổ chức cấp chứng từ chứng nhận
205
+ xuất xứ hàng hóa, cơ sở sản xuất hàng hóa xuất khẩu
206
+
207
+ 1. Trường hợp thông tin, hồ sơ, chứng từ, tài liệu, dữ liệu, kết quả kiểm tra
208
+ tại cơ sở sản xuất, xác minh tại cơ quan, tổ chức cấp chứng từ chứng nhận xuất
209
+ xứ hàng hóa, nội dung giải trình của người khai hải quan đủ cơ sở chứng minh nội
210
+ dung khai xuất xứ hàng hóa là phù hợp thì cơ quan hải quan chấp nhận nội dung
211
+ khai của người khai hải quan về xuất xứ hàng hóa.
212
+
213
+ 2. Trường hợp thông tin, hồ sơ, chứng từ, tài liệu, dữ liệu, kết quả kiểm tra
214
+ tại cơ sở sản xuất, xác minh tại cơ quan, tổ chức cấp chứng từ chứng nhận xuất
215
+ xứ hàng hóa, nội dung giải trình của người khai hải quan không đủ cơ sở chứng
216
+ minh nội dung khai xuất xứ hàng hóa là phù hợp, cơ quan hải quan căn cứ vào các
217
+ hồ sơ hiện có để xử lý theo quy định và yêu cầu người khai hải quan khai bổ sung
218
+ xuất xứ chính xác theo kết quả kiểm tra, xác minh, xác định xuất xứ hàng hóa của
219
+ cơ quan hải quan.
220
+
221
+ 3. Trường hợp có cơ sở nghi ngờ người khai hải quan khai xuất xứ hàng hóa không
222
+ chính xác để chuyển tải bất hợp pháp, lẩn tránh thuế chống bán phá giá, thuế chống
223
+ trợ cấp, thuế tự vệ hoặc các biện pháp phòng vệ thương mại khác thì Cục Hải quan
224
+ tỉnh, thành phố báo cáo, đề xuất Tổng cục Hải quan phối hợp với Bộ Công Thương
225
+ để xử lý theo quy định.'
226
+ - source_sentence: Chạy xe ô tô không thắt dây an toàn sẽ bị xử phạt bao nhiêu tiền?
227
+ sentences:
228
+ - "“Căn cứ các quy định trên, Cục Thuế TP Hà Nội có ý kiến như sau: Trường hợp Đài\
229
+ \ Tiếng nói Việt Nam có hoạt động phát sóng truyền thanh, truyền hình bằng nguồn\
230
+ \ vốn ngân sách nhà nước thì hoạt động này thuộc đối tượng không chịu thuế GTGT\
231
+ \ theo quy định tại Khoản 14 Điều 4 Thông tư số 219/2013/TT BTC ngày 31/12/2013\
232
+ \ của Bộ Tài chính. Các hoạt động phát sóng truyền thanh, truyền hình không bằng\
233
+ \ nguồn vốn ngân sách nhà nước thì không thuộc đối tượng không chịu thuế GTGT.\
234
+ \ \nĐối với hoạt động sản xuất chương trình truyền hình, đề nghị Đài Tiếng nói\
235
+ \ Việt Nam căn cứ tình hình thực tế để áp dụng mức thuế suất thuế GTGT theo quy\
236
+ \ định tại Điều 10 và Điều 11 Thông tư số 219/2013/TT-BTC ngày 31/12/2013 của\
237
+ \ Bộ Tài chính.\nĐề nghị Đài Tiếng nói Việt Nam căn cứ vào tình hình thực tế,\
238
+ \ đối chiếu với các quy định của pháp luật để thực hiện.”"
239
+ - '"1. Về các nhóm hàng hóa, dịch vụ không được giảm thuế giá trị gia tăng
240
+
241
+ Căn cứ khoản 1 Điều 1 Nghị định số 15/2022/NĐ-CP thì Nghị định số 15/2022/NĐ-CP
242
+ quy định loại trừ các nhóm hàng hóa, dịch vụ cụ thể không được giảm thuế và được
243
+ chi tiết tại Phụ lục I, II, III ban hành kèm theo Nghị định số 15/2022/NĐ-CP.
244
+ Các Cục Thuế hướng dẫn người nộp thuế đối chiếu hàng hóa, dịch vụ mà người nộp
245
+ thuế sản xuất, kinh doanh với các nhóm hàng hóa, dịch vụ loại trừ không được giảm
246
+ thuế tại khoản 1 Điều 1 Nghị định số 15/2002/NĐ-CP và Danh mục hàng hóa, dịch
247
+ vụ không được giảm thuế tại Phụ lục I, II, III ban hành kèm theo Nghị định số
248
+ 15/2022/NĐ-CP để thực hiện đúng quy định."'
249
+ - 'Điều 5. Xử phạt người điều khiển xe ô tô và các loại xe tương tự xe ô tô vi phạm
250
+ quy tắc giao thông đường bộ
251
+
252
+ ...
253
+
254
+ 3. Phạt tiền từ 800.000 đồng đến 1.000.000 đồng đối với người điều khiển xe thực
255
+ hiện một trong các hành vi vi phạm sau đây:
256
+
257
+ a) Điều khiển xe chạy quá tốc độ quy định từ 05 km/h đến dưới 10 km/h;
258
+
259
+ b) Bấm còi, rú ga liên tục; bấm còi hơi, sử dụng đèn chiếu xa trong đô thị, khu
260
+ đông dân cư, trừ các xe ưu tiên đang đi làm nhiệm vụ theo quy định;
261
+
262
+ c) Chuyển hướng không giảm tốc độ hoặc không có tín hiệu báo hướng rẽ (trừ trường
263
+ hợp điều khiển xe đi theo hướng cong của đoạn đường bộ ở nơi đường không giao
264
+ nhau cùng mức);
265
+
266
+ d) Không tuân thủ các quy định về dừng xe, đỗ xe tại nơi đường bộ giao nhau cùng
267
+ mức với đường sắt; dừng xe, đỗ xe trong phạm vi an toàn của đường sắt, trừ hành
268
+ vi vi phạm quy định tại điểm b khoản 2, điểm b khoản 3 Điều 49 Nghị định này;
269
+
270
+ đ) Dừng xe, đỗ xe tại vị trí: nơi đường bộ giao nhau hoặc trong phạm vi 05 m tính
271
+ từ mép đường giao nhau; điểm dừng đón, trả khách của xe buýt; trước cổng hoặc
272
+ trong phạm vi 05 m hai bên cổng trụ sở cơ quan, tổ chức có bố trí đường cho xe
273
+ ô tô ra vào; nơi phần đường có bề rộng chỉ đủ cho một làn xe; che khuất biển báo
274
+ hiệu đường bộ; nơi mở dải phân cách giữa;
275
+
276
+ e) Đỗ xe không sát theo lề đường, hè phố phía bên phải theo chiều đi hoặc bánh
277
+ xe gần nhất cách lề đường, hè phố quá 0,25 m; đỗ xe trên đường xe điện, đường
278
+ dành riêng cho xe buýt; đỗ xe trên miệng cống thoát nước, miệng hầm của đường
279
+ điện thoại, điện cao thế, chỗ dành riêng cho xe chữa cháy lấy nước; đỗ, để xe
280
+ ở hè phố trái quy định của pháp luật; đỗ xe nơi có biển “Cấm đỗ xe” hoặc biển
281
+ “Cấm dừng xe và đỗ xe”, trừ hành vi vi phạm quy định tại điểm i khoản 4, điểm
282
+ d khoản 7 Điều này;
283
+
284
+ g) Không sử dụng hoặc sử dụng không đủ đèn chiếu sáng trong thời gian từ 19 giờ
285
+ ngày hôm trước đến 05 giờ ngày hôm sau, khi sương mù, thời tiết xấu hạn chế tầm
286
+ nhìn; sử dụng đèn chiếu xa khi tránh xe đi ngược chiều;
287
+
288
+ h) Điều khiển xe ô tô kéo theo xe khác, vật khác (trừ trường hợp kéo theo một
289
+ rơ moóc, sơ mi rơ moóc hoặc một xe ô tô, xe máy chuyên dùng khác khi xe này không
290
+ tự chạy được); điều khiển xe ô tô đẩy xe khác, vật khác; điều khiển xe kéo rơ
291
+ moóc, sơ mi rơ moóc kéo thêm rơ moóc hoặc xe khác, vật khác; không nối chắc chắn,
292
+ an toàn giữa xe kéo và xe được kéo khi kéo nhau;
293
+
294
+ i) Chở người trên xe được kéo, trừ người điều khiển;
295
+
296
+ k) Quay đầu xe tại nơi đường bộ giao nhau cùng mức với đường sắt; quay đầu xe
297
+ tại nơi đường hẹp, đường dốc, đoạn đường cong tầm nhìn bị che khuất, nơi có biển
298
+ báo hiệu có nội dung cấm quay đầu ��ối với loại phương tiện đang điều khiển; điều
299
+ khiển xe rẽ trái tại nơi có biển báo hiệu có nội dung cấm rẽ trái đối với loại
300
+ phương tiện đang điều khiển; điều khiển xe rẽ phải tại nơi có biển báo hiệu có
301
+ nội dung cấm rẽ phải đối với loại phương tiện đang điều khiển;
302
+
303
+ l) Không giữ khoảng cách an toàn để xảy ra va chạm với xe chạy liền trước hoặc
304
+ không giữ khoảng cách theo quy định của biển báo hiệu “Cự ly tối thiểu giữa hai
305
+ xe”, trừ các hành vi vi phạm quy định tại điểm g khoản 5 Điều này;
306
+
307
+ m) Không giảm tốc độ và nhường đường khi điều khiển xe chạy từ trong ngõ, đường
308
+ nhánh ra đường chính;
309
+
310
+ n) Không nhường đường cho xe đi trên đường ưu tiên, đường chính từ bất kỳ hướng
311
+ nào tới tại nơi đường giao nhau;
312
+
313
+ o) Lùi xe ở đường một chiều, đường có biển “Cấm đi ngược chiều”, khu vực cấm dừng,
314
+ trên phần đường dành cho người đi bộ qua đường, nơi đường bộ giao nhau, nơi đường
315
+ bộ giao nhau cùng mức với đường sắt, nơi tầm nhìn bị che khuất; lùi xe không quan
316
+ sát hoặc không có tín hiệu báo trước, trừ hành vi vi phạm quy định tại điểm a
317
+ khoản 8 Điều này;
318
+
319
+ p) Không thắt dây an toàn khi điều khiển xe chạy trên đường;
320
+
321
+ q) Chở người trên xe ô tô không thắt dây an toàn (tại vị trí có trang bị dây an
322
+ toàn) khi xe đang chạy;
323
+
324
+ r) Chạy trong hầm đường bộ không sử dụng đèn chiếu sáng gần;
325
+
326
+ s) Điều khiển xe chạy dưới tốc độ tối thiểu trên những đoạn đường bộ có quy định
327
+ tốc độ tối thiểu cho phép.
328
+
329
+ ..."'
330
+ - source_sentence: Chủ tịch Hội đồng Giáo sư nhà nước do ai bổ nhiệm?
331
+ sentences:
332
+ - 'Trong trường hợp đình chỉ điều tra thì bản kết luận điều tra ghi rõ diễn biến
333
+ sự việc, quá trình điều tra, lý do và căn cứ đình chỉ điều tra.
334
+
335
+ Bản kết luận điều tra phải ghi rõ ngày, tháng, năm ra kết luận; họ tên, chức vụ
336
+ và chữ ký của người ra kết luận điều tra.
337
+
338
+ Quyết định đình chỉ điều tra ghi rõ thời gian, địa điểm ra quyết định, lý do và
339
+ căn cứ đình chỉ điều tra, việc hủy bỏ biện pháp ngăn chặn, biện pháp cưỡng chế,
340
+ trả lại tài liệu, đồ vật đã tạm giữ (nếu có), việc xử lý vật chứng và các vấn
341
+ đề khác có liên quan.'
342
+ - 'Cơ cấu và trình tự thành lập Hội đồng Giáo sư nhà nước
343
+
344
+ 1. Hội đồng Giáo sư nhà nước gồm: Chủ tịch; một Phó Chủ tịch kiêm Tổng thư ký;
345
+ một Phó Chủ tịch phụ trách các nhóm ngành khoa học tự nhiên, kỹ thuật, công nghệ;
346
+ một Phó Chủ tịch phụ trách nhóm ngành khoa học sức khỏe; một Phó Chủ tịch phụ
347
+ trách các nhóm ngành khoa học xã hội và nhân văn, nghệ thuật, thể dục thể thao
348
+ và các Ủy viên. Chủ tịch Hội đồng là Bộ trưởng Bộ Giáo dục và Đào tạo.
349
+
350
+ 2. Thủ tướng Chính phủ quyết định thành lập Hội đồng Giáo sư nhà nước; bổ nhiệm
351
+ Chủ tịch, Phó Chủ tịch kiêm Tổng thư ký và các Phó Chủ tịch theo đề nghị của Bộ
352
+ trưởng Bộ Giáo dục và Đào tạo.
353
+
354
+ 3. Thủ tướng Chính phủ giao Bộ trưởng Bộ Giáo dục và Đào tạo - Chủ tịch Hội đồng
355
+ Giáo sư nhà nước quyết định bổ nhiệm các Ủy viên Hội đồng Giáo sư nhà nước và
356
+ xem xét điều chỉnh, bổ sung thường xuyên hàng năm.
357
+
358
+ 4. Nhiệm kỳ của Hội đồng Giáo sư nhà nước là 05 năm. Thành viên Hội đồng Giáo
359
+ sư nhà nước tham gia không quá 2 nhiệm kỳ liên tiếp. Chủ tịch, Phó Chủ tịch và
360
+ các Ủy viên của Hội đồng làm việc theo chế độ kiêm nhiệm. Phó Chủ tịch kiêm Tổng
361
+ thư ký làm việc theo chế độ chuyên trách.
362
+
363
+ ...'
364
+ - '"Điều 8. Mức hỗ trợ từ ngân sách nhà nước
365
+
366
+ 1. Từ ngày Nghị định này có hiệu lực thi hành, mức hỗ trợ từ ngân sách nhà nước
367
+ cho một số đối tượng như sau:
368
+
369
+ a) Hỗ trợ 100% mức đóng bảo hiểm y tế đối với người thuộc hộ gia đình cận nghèo
370
+ đang sinh sống tại các huyện nghèo theo Nghị quyết số 30a/2008/NQ-CP ngày 27 tháng
371
+ 12 năm 2008 của Chính phủ về chương trình hỗ trợ giảm nghèo nhanh và bền vững
372
+ và các huyện được áp dụng cơ chế, chính sách theo Nghị quyết số 30a/2008/NQ-CP;
373
+
374
+ b) Hỗ trợ tối thiểu 70% mức đóng bảo hiểm y tế đối với đối tượng quy định tại
375
+ khoản 1 và 2 Điều 4 Nghị định này;
376
+
377
+ c) Hỗ trợ tối thiểu 30% mức đóng bảo hiểm y tế đối với đối tượng quy định tại
378
+ khoản 3 và 4 Điều 4 Nghị định này.
379
+
380
+ 2. Trường hợp một người thuộc nhiều đối tượng được ngân sách nhà nước hỗ trợ mức
381
+ đóng quy định tại khoản 1 Điều này thì được hưởng mức hỗ trợ đóng bảo hiểm y tế
382
+ theo đối tượng có mức hỗ trợ cao nhất.
383
+
384
+ 3. Ủy ban nhân dân tỉnh, thành phố trực thuộc trung ương căn cứ khả năng ngân
385
+ sách địa phương và các nguồn hợp pháp khác, kể cả 20% số kinh phí quy định tại
386
+ điểm a khoản 3 Điều 35 của Luật bảo hiểm y tế (nếu có) xây dựng và trình Hội đồng
387
+ nhân dân cấp tỉnh quyết định mức hỗ trợ đóng bảo hiểm y tế cao hơn mức hỗ trợ
388
+ tối thiểu quy định tại khoản 1 Điều này."'
389
+ - source_sentence: Có thể nộp hồ sơ kiểm định và cấp Giấy chứng nhận kiểm định phương
390
+ tiện phòng cháy và chữa cháy thông qua Cổng dịch vụ công được hay không?
391
+ sentences:
392
+ - "Thủ tục: Cấp lại Giấy phép vận chuyển hàng hóa nguy hiểm về cháy, nổ thuộc loại\
393
+ \ 1, loại 2, loại 3, loại 4 và loại 9 bằng phương tiện giao thông cơ giới đường\
394
+ \ bộ, trên đường thủy nội địa (trừ vật liệu nổ công nghiệp)\n...\n3.2. Cách thức\
395
+ \ thực hiện:\n- Nộp hồ sơ trực tiếp tại Bộ phận Một cửa thuộc Phòng Cảnh sát phòng\
396
+ \ cháy, chữa cháy và cứu nạn, cứu hộ Công an cấp tỉnh hoặc Bộ phận Một cửa của\
397
+ \ Công an tỉnh hoặc Trung tâm phục vụ hành chính công của tỉnh (trường hợp đã\
398
+ \ đưa thủ tục ra tiếp nhận tại Trung tâm phục vụ hành chính công);\n- Trực tuyến\
399
+ \ tại Cổng dịch vụ công (nếu có);\n- Thông qua dịch vụ bưu chính công ích, qua\
400
+ \ dịch vụ của doanh nghiệp, cá nhân hoặc qua ủy quyền theo quy định của pháp luật.\n\
401
+ Thời gian tiếp nhận hồ sơ: Giờ hành chính các ngày làm việc từ thứ 2 đến thứ 6\
402
+ \ và sáng thứ 7 hàng tuần (trừ các ngày nghỉ lễ, tết theo quy định của pháp luật).\
403
+ \ \n..."
404
+ - '"2. Đối tượng cách ly tại nhà: Người mắc COVID-19 bao gồm cả trẻ em thỏa tiêu
405
+ chí lâm sàng và có khả năng tự chăm sóc, theo dõi sức khỏe hoặc có người hỗ trợ
406
+ chăm sóc.
407
+
408
+ a) Tiêu chí lâm sàng
409
+
410
+ (1) Người có kết quả xét nghiệm RT-PCR hoặc xét nghiệm nhanh kháng nguyên SARS-CoV-2
411
+ dương tính bằng các loại sinh phẩm xét nghiệm nhanh kháng nguyên được Bộ Y tế
412
+ cấp phép lưu hành do bản thân hoặc người chăm sóc tự làm tại nhà hoặc do nhân
413
+ viên y tế, cơ sở y tế thực hiện.
414
+
415
+ - Không có triệu chứng hoặc có triệu chứng lâm sàng ở mức độ nhẹ như sốt, ho khan,
416
+ đau họng, nghẹt mũi, mệt mỏi, đau đầu, đau mỏi cơ, tê lưỡi, tiêu chảy, chảy mũi,
417
+ mất khứu giác, mất vị giác; nhịp thở bình thường theo tuổi (trẻ dưới 2 tháng tuổi
418
+ < 60 lần/phút, trẻ từ 2 đến dưới 12 tháng tuổi < 50 lần/phút, trẻ từ 12 tháng
419
+ đến dưới 5 tuổi < 40 lần/phút, trẻ từ 5 đến dưới 12 tuổi < 30 lần/phút, trẻ từ
420
+ 12 tuổi trở lên và người lớn < 20 lần/phút), SpO2 ≥ 96% khi thở khí trời, không
421
+ có cảm giác khó thở, không suy hô hấp.
422
+
423
+ - Không mắc bệnh nền hoặc có bệnh nền nhưng đang được điều trị ổn định và có nguyện
424
+ vọng cách ly tại nhà.
425
+
426
+ (2) F0 điều trị tại các cơ sở thu dung, điều trị COVID-19 ít nhất 05 ngày, các
427
+ triệu chứng lâm sàng đỡ, giảm nhiều, hết sốt (không dùng thuốc hạ sốt) trước ngày
428
+ ra viện từ 3 ngày trở lên, có kết quả xét nghiệm RT-PCR dương tính với CT < 30
429
+ hoặc xét nghiệm nhanh kháng nguyên dương tính thì có thể xuất viện về nhà, tiếp
430
+ tục cách ly đủ 10 ngày (không nhất thiết phải làm lại xét nghiệm).
431
+
432
+ b) Tiêu chí về khả năng tự chăm sóc và theo dõi sức khỏe: F0 có thể tự chăm sóc
433
+ bản thân (như ăn uống, tắm rửa, giặt quần áo, vệ sinh và có thể tự theo dõi sức
434
+ khỏe theo hướng dẫn của nhân viên y tế...); có khả năng liên lạc với nhân viên
435
+ y tế để được theo dõi, giám sát và khi có tình trạng cấp cứu. Trường hợp F0 là
436
+ trẻ em hoặc người không tự chăm sóc được thì cần phải có người hỗ trợ chăm sóc.
437
+
438
+ Lưu ý: Nếu F0 hội đủ 2 tiêu chí trên nhưng hộ gia đình có người thuộc nhóm nguy
439
+ cơ (người có bệnh nền, người trên 50 tuổi, phụ nữ có thai, người chưa tiêm đủ
440
+ liều vắc xin phòng COVID-19), khuyến khích F0 cách ly nơi khác (không có người
441
+ thuộc nhóm nguy cơ hoặc cách ly tập trung) để giảm nguy cơ lây lan cho các thành
442
+ viên khác trong hộ gia đình, nhất là người thuộc nhóm nguy cơ."'
443
+ - '"Điều 3. Điều kiện hưởng chế độ ốm đau
444
+
445
+ 1. Người lao động quy định tại các điểm a, b, c, d, đ khoản 1 và điểm b khoản
446
+ 2 Điều 2 của Nghị định số 115/2015/NĐ-CP được hưởng chế độ ốm đau trong các trường
447
+ hợp sau:
448
+
449
+ a) Người lao động bị ốm đau, tai nạn mà không phải là tai nạn lao động hoặc điều
450
+ trị thương tật, bệnh tật tái phát do tai nạn lao động, bệnh nghề nghiệp phải nghỉ
451
+ việc và có xác nhận của cơ sở khám bệnh, chữa bệnh có thẩm quyền theo quy định
452
+ của Bộ Y tế.
453
+
454
+ b) Người lao động phải nghỉ việc để chăm sóc con dưới 07 tuổi bị ốm đau và có
455
+ xác nhận của cơ sở khám bệnh, chữa bệnh có thẩm quyền.
456
+
457
+ c) Lao động nữ đi làm trước khi hết thời hạn nghỉ sinh con mà thuộc một trong
458
+ các trường hợp quy định tại điểm a và điểm b khoản này.
459
+
460
+ 2. Không giải quyết chế độ ốm đau đối với các trường hợp sau đây:
461
+
462
+ a) Người lao động bị ốm đau, tai nạn phải nghỉ việc do tự hủy hoại sức khỏe, do
463
+ say rượu hoặc sử dụng chất ma túy, tiền chất ma túy theo Danh mục ban hành kèm
464
+ theo Nghị định số 82/2013/NĐ-CP ngày 19 tháng 7 năm 2013 của Chính phủ ban hành
465
+ các danh mục chất ma túy và tiền chất và Nghị định số 126/2015/NĐ-CP ngày 09 tháng
466
+ 12 năm 2015 của Chính phủ sửa đổi, bổ sung Danh mục các chất ma túy và tiền chất
467
+ ban hành kèm theo Nghị định số 82/2013/NĐ-CP ngày 19 tháng 7 năm 2013 của Chính
468
+ phủ ban hành các danh mục chất ma túy và tiền chất.
469
+
470
+ b) Người lao động nghỉ việc điều trị lần đầu do tai nạn lao động, bệnh nghề nghiệp.
471
+
472
+ c) Người lao động bị ốm đau, tai nạn mà không phải là tai nạn lao động trong thời
473
+ gian đang nghỉ phép hằng năm, nghỉ việc riêng, nghỉ không hưởng lương theo quy
474
+ định của pháp luật lao động; nghỉ việc hưởng chế độ thai sản theo quy định của
475
+ pháp luật về bảo hiểm xã hội."'
476
+ pipeline_tag: sentence-similarity
477
+ library_name: sentence-transformers
478
  ---
479
+
480
+ # VN-legalDocs-SBERT
481
+
482
+ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [google-bert/bert-base-multilingual-cased](https://huggingface.co/google-bert/bert-base-multilingual-cased). It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
483
+
484
+ ## Model Details
485
+
486
+ ### Model Description
487
+ - **Model Type:** Sentence Transformer
488
+ - **Base model:** [google-bert/bert-base-multilingual-cased](https://huggingface.co/google-bert/bert-base-multilingual-cased) <!-- at revision 3f076fdb1ab68d5b2880cb87a0886f315b8146f8 -->
489
+ - **Maximum Sequence Length:** 512 tokens
490
+ - **Output Dimensionality:** 768 dimensions
491
+ - **Similarity Function:** Cosine Similarity
492
+ <!-- - **Training Dataset:** Unknown -->
493
+ - **Language:** vi
494
+ - **License:** mit
495
+
496
+ ### Model Sources
497
+
498
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
499
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
500
+ - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
501
+
502
+ ### Full Model Architecture
503
+
504
+ ```
505
+ SentenceTransformer(
506
+ (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: BertModel
507
+ (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
508
+ )
509
+ ```
510
+
511
+ ## Usage
512
+
513
+ ### Direct Usage (Sentence Transformers)
514
+
515
+ First install the Sentence Transformers library:
516
+
517
+ ```bash
518
+ pip install -U sentence-transformers
519
+ ```
520
+
521
+ Then you can load this model and run inference.
522
+ ```python
523
+ from sentence_transformers import SentenceTransformer
524
+
525
+ # Download from the 🤗 Hub
526
+ model = SentenceTransformer("google-bert/bert-base-multilingual-cased")
527
+ # Run inference
528
+ sentences = [
529
+ 'Có thể nộp hồ sơ kiểm định và cấp Giấy chứng nhận kiểm định phương tiện phòng cháy và chữa cháy thông qua Cổng dịch vụ công được hay không?',
530
+ 'Thủ tục: Cấp lại Giấy phép vận chuyển hàng hóa nguy hiểm về cháy, nổ thuộc loại 1, loại 2, loại 3, loại 4 và loại 9 bằng phương tiện giao thông cơ giới đường bộ, trên đường thủy nội địa (trừ vật liệu nổ công nghiệp)\n...\n3.2. Cách thức thực hiện:\n- Nộp hồ sơ trực tiếp tại Bộ phận Một cửa thuộc Phòng Cảnh sát phòng cháy, chữa cháy và cứu nạn, cứu hộ Công an cấp tỉnh hoặc Bộ phận Một cửa của Công an tỉnh hoặc Trung tâm phục vụ hành chính công của tỉnh (trường hợp đã đưa thủ tục ra tiếp nhận tại Trung tâm phục vụ hành chính công);\n- Trực tuyến tại Cổng dịch vụ công (nếu có);\n- Thông qua dịch vụ bưu chính công ích, qua dịch vụ của doanh nghiệp, cá nhân hoặc qua ủy quyền theo quy định của pháp luật.\nThời gian tiếp nhận hồ sơ: Giờ hành chính các ngày làm việc từ thứ 2 đến thứ 6 và sáng thứ 7 hàng tuần (trừ các ngày nghỉ lễ, tết theo quy định của pháp luật). \n...',
531
+ '"Điều 3. Điều kiện hưởng chế độ ốm đau\n1. Người lao động quy định tại các điểm a, b, c, d, đ khoản 1 và điểm b khoản 2 Điều 2 của Nghị định số 115/2015/NĐ-CP được hưởng chế độ ốm đau trong các trường hợp sau:\na) Người lao động bị ốm đau, tai nạn mà không phải là tai nạn lao động hoặc điều trị thương tật, bệnh tật tái phát do tai nạn lao động, bệnh nghề nghiệp phải nghỉ việc và có xác nhận của cơ sở khám bệnh, chữa bệnh có thẩm quyền theo quy định của Bộ Y tế.\nb) Người lao động phải nghỉ việc để chăm sóc con dưới 07 tuổi bị ốm đau và có xác nhận của cơ sở khám bệnh, chữa bệnh có thẩm quyền.\nc) Lao động nữ đi làm trước khi hết thời hạn nghỉ sinh con mà thuộc một trong các trường hợp quy định tại điểm a và điểm b khoản này.\n2. Không giải quyết chế độ ốm đau đối với các trường hợp sau đây:\na) Người lao động bị ốm đau, tai nạn phải nghỉ việc do tự hủy hoại sức khỏe, do say rượu hoặc sử dụng chất ma túy, tiền chất ma túy theo Danh mục ban hành kèm theo Nghị định số 82/2013/NĐ-CP ngày 19 tháng 7 năm 2013 của Chính phủ ban hành các danh mục chất ma túy và tiền chất và Nghị định số 126/2015/NĐ-CP ngày 09 tháng 12 năm 2015 của Chính phủ sửa đổi, bổ sung Danh mục các chất ma túy và tiền chất ban hành kèm theo Nghị định số 82/2013/NĐ-CP ngày 19 tháng 7 năm 2013 của Chính phủ ban hành các danh mục chất ma túy và tiền chất.\nb) Người lao động nghỉ việc điều trị lần đầu do tai nạn lao động, bệnh nghề nghiệp.\nc) Người lao động bị ốm đau, tai nạn mà không phải là tai nạn lao động trong thời gian đang nghỉ phép hằng năm, nghỉ việc riêng, nghỉ không hưởng lương theo quy định của pháp luật lao động; nghỉ việc hưởng chế độ thai sản theo quy định của pháp luật về bảo hiểm xã hội."',
532
+ ]
533
+ embeddings = model.encode(sentences)
534
+ print(embeddings.shape)
535
+ # [3, 768]
536
+
537
+ # Get the similarity scores for the embeddings
538
+ similarities = model.similarity(embeddings, embeddings)
539
+ print(similarities.shape)
540
+ # [3, 3]
541
+ ```
542
+
543
+ <!--
544
+ ### Direct Usage (Transformers)
545
+
546
+ <details><summary>Click to see the direct usage in Transformers</summary>
547
+
548
+ </details>
549
+ -->
550
+
551
+ <!--
552
+ ### Downstream Usage (Sentence Transformers)
553
+
554
+ You can finetune this model on your own dataset.
555
+
556
+ <details><summary>Click to expand</summary>
557
+
558
+ </details>
559
+ -->
560
+
561
+ <!--
562
+ ### Out-of-Scope Use
563
+
564
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
565
+ -->
566
+
567
+ <!--
568
+ ## Bias, Risks and Limitations
569
+
570
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
571
+ -->
572
+
573
+ <!--
574
+ ### Recommendations
575
+
576
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
577
+ -->
578
+
579
+ ## Training Details
580
+
581
+ ### Training Dataset
582
+
583
+ #### Unnamed Dataset
584
+
585
+ * Size: 99,580 training samples
586
+ * Columns: <code>text_0</code> and <code>text_1</code>
587
+ * Approximate statistics based on the first 1000 samples:
588
+ | | text_0 | text_1 |
589
+ |:--------|:----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
590
+ | type | string | string |
591
+ | details | <ul><li>min: 8 tokens</li><li>mean: 25.64 tokens</li><li>max: 58 tokens</li></ul> | <ul><li>min: 13 tokens</li><li>mean: 278.08 tokens</li><li>max: 512 tokens</li></ul> |
592
+ * Samples:
593
+ | text_0 | text_1 |
594
+ |:---------------------------------------------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
595
+ | <code>Liên đoàn Luật sư Việt Nam là tổ chức xã hội – nghề nghiệp có tư cách pháp nhân, có con dấu, tài khoản riêng?</code> | <code>“Điều 2. Địa vị pháp lý của Liên đoàn Luật sư Việt Nam<br>1. Liên đoàn Luật sư Việt Nam là tổ chức xã hội - nghề nghiệp thống nhất trong toàn quốc của các Đoàn Luật sư, các luật sư Việt Nam; có tư cách pháp nhân, có con dấu, tài khoản.<br>2. Biểu tượng của Liên đoàn Luật sư Việt Nam là hình tròn nền xanh da trời, chính giữa là cán cân công lý gắn với hình tượng cuốn sách, dưới cán cân công lý là dòng chữ “VIETNAM BAR FEDERATION", hai bên mỗi bên có ba dải màu vàng đậm, phía trên là ngôi sao vàng hình cờ Tổ quốc Việt Nam và dòng chữ Liên đoàn Luật sư Việt Nam.<br>3. Tên giao dịch quốc tế của Liên đoàn Luật sư Việt Nam là Vietnam Bar Federation (viết tắt là VBF).<br>4. Trụ sở của Liên đoàn Luật sư Việt Nam đặt tại Hà Nội – Thủ đô nước Cộng hoà xã hội chủ nghĩa Việt Nam.”</code> |
596
+ | <code>Tên hợp tác xã bị rơi vào trường hợp cấm thì cơ quan nào có quyền từ chối chấp thuận đối với tên đó?</code> | <code>"Điều 7. Tên hợp tác xã, liên hiệp hợp tác xã<br>1. Tên hợp tác xã, liên hiệp hợp tác xã được viết bằng tiếng Việt hoặc ký tự La - tinh trừ ký tự đặc biệt, có thể kèm theo chữ số, ký hiệu và được bắt đầu b��ng cụm từ “hợp tác xã” hoặc “liên hiệp hợp tác xã” sau đó là tên riêng của hợp tác xã, liên hiệp hợp tác xã.<br>2. Hợp tác xã, liên hiệp hợp tác xã có thể sử dụng ngành, nghề kinh doanh hay ký hiệu phụ trợ khác để cấu thành tên hợp tác xã, liên hiệp hợp tác xã.<br>3. Tên hợp tác xã, liên hiệp hợp tác xã phải được viết hoặc gắn tại trụ sở chính, chi nhánh, văn phòng đại diện của hợp tác xã, liên hiệp hợp tác xã. Tên hợp tác xã, liên hiệp hợp tác xã phải được in hoặc viết trên các giấy tờ giao dịch, hồ sơ tài liệu và ấn phẩm do hợp tác xã, liên hiệp hợp tác xã phát hành.<br>4. Cơ quan đăng ký hợp tác xã có quyền từ chối chấp thuận tên dự kiến đăng ký của hợp tác xã, liên hiệp hợp tác xã nếu tên đó không phù hợp với quy định tại Điều 8 Nghị định này.<br>5. Cơ quan đăng ký hợp tác xã có trách nhiệm côn...</code> |
597
+ | <code>Tên hợp tác xã bị rơi vào trường hợp cấm thì cơ quan nào có quyền từ chối chấp thuận đối với tên đó?</code> | <code>Cơ quan đăng ký hợp tác xã<br>1. Khi thành lập, hợp tác xã, liên hiệp hợp tác xã phải tiến hành đăng ký tại cơ quan đăng ký hợp tác xã nơi hợp tác xã, liên hiệp hợp tác xã dự định thành lập đặt trụ sở chính.<br>a) Liên hiệp hợp tác xã, quỹ tín dụng nhân dân đăng ký tại phòng đăng ký kinh doanh thuộc sở kế hoạch và đầu tư;<br>b) Hợp tác xã đăng ký tại phòng tài chính - kế hoạch thuộc Ủy ban nhân dân cấp huyện.<br>2. Quyền và nhiệm vụ của cơ quan đăng ký hợp tác xã:<br>a) Trực tiếp nhận hồ sơ đăng ký hợp tác xã, liên hiệp hợp tác xã, chi nhánh, văn phòng đại diện, địa điểm kinh doanh hợp tác xã, liên hiệp hợp tác xã; cấp, thay đổi, thu hồi giấy chứng nhận đăng ký hợp tác xã, liên hiệp hợp tác xã, giấy chứng nhận đăng ký hoạt động chi nhánh, văn phòng đại diện, địa điểm kinh doanh hợp tác xã, liên hiệp hợp tác xã;<br>...</code> |
598
+ * Loss: [<code>CachedMultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#cachedmultiplenegativesrankingloss) with these parameters:
599
+ ```json
600
+ {
601
+ "scale": 20.0,
602
+ "similarity_fct": "cos_sim",
603
+ "mini_batch_size": 32
604
+ }
605
+ ```
606
+
607
+ ### Training Hyperparameters
608
+ #### Non-Default Hyperparameters
609
+
610
+ - `per_device_train_batch_size`: 128
611
+ - `learning_rate`: 3e-05
612
+ - `num_train_epochs`: 5
613
+ - `warmup_ratio`: 0.1
614
+ - `fp16`: True
615
+ - `batch_sampler`: no_duplicates
616
+
617
+ #### All Hyperparameters
618
+ <details><summary>Click to expand</summary>
619
+
620
+ - `overwrite_output_dir`: False
621
+ - `do_predict`: False
622
+ - `eval_strategy`: no
623
+ - `prediction_loss_only`: True
624
+ - `per_device_train_batch_size`: 128
625
+ - `per_device_eval_batch_size`: 8
626
+ - `per_gpu_train_batch_size`: None
627
+ - `per_gpu_eval_batch_size`: None
628
+ - `gradient_accumulation_steps`: 1
629
+ - `eval_accumulation_steps`: None
630
+ - `torch_empty_cache_steps`: None
631
+ - `learning_rate`: 3e-05
632
+ - `weight_decay`: 0.0
633
+ - `adam_beta1`: 0.9
634
+ - `adam_beta2`: 0.999
635
+ - `adam_epsilon`: 1e-08
636
+ - `max_grad_norm`: 1.0
637
+ - `num_train_epochs`: 5
638
+ - `max_steps`: -1
639
+ - `lr_scheduler_type`: linear
640
+ - `lr_scheduler_kwargs`: {}
641
+ - `warmup_ratio`: 0.1
642
+ - `warmup_steps`: 0
643
+ - `log_level`: passive
644
+ - `log_level_replica`: warning
645
+ - `log_on_each_node`: True
646
+ - `logging_nan_inf_filter`: True
647
+ - `save_safetensors`: True
648
+ - `save_on_each_node`: False
649
+ - `save_only_model`: False
650
+ - `restore_callback_states_from_checkpoint`: False
651
+ - `no_cuda`: False
652
+ - `use_cpu`: False
653
+ - `use_mps_device`: False
654
+ - `seed`: 42
655
+ - `data_seed`: None
656
+ - `jit_mode_eval`: False
657
+ - `use_ipex`: False
658
+ - `bf16`: False
659
+ - `fp16`: True
660
+ - `fp16_opt_level`: O1
661
+ - `half_precision_backend`: auto
662
+ - `bf16_full_eval`: False
663
+ - `fp16_full_eval`: False
664
+ - `tf32`: None
665
+ - `local_rank`: 0
666
+ - `ddp_backend`: None
667
+ - `tpu_num_cores`: None
668
+ - `tpu_metrics_debug`: False
669
+ - `debug`: []
670
+ - `dataloader_drop_last`: False
671
+ - `dataloader_num_workers`: 0
672
+ - `dataloader_prefetch_factor`: None
673
+ - `past_index`: -1
674
+ - `disable_tqdm`: False
675
+ - `remove_unused_columns`: True
676
+ - `label_names`: None
677
+ - `load_best_model_at_end`: False
678
+ - `ignore_data_skip`: False
679
+ - `fsdp`: []
680
+ - `fsdp_min_num_params`: 0
681
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
682
+ - `tp_size`: 0
683
+ - `fsdp_transformer_layer_cls_to_wrap`: None
684
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
685
+ - `deepspeed`: None
686
+ - `label_smoothing_factor`: 0.0
687
+ - `optim`: adamw_torch
688
+ - `optim_args`: None
689
+ - `adafactor`: False
690
+ - `group_by_length`: False
691
+ - `length_column_name`: length
692
+ - `ddp_find_unused_parameters`: None
693
+ - `ddp_bucket_cap_mb`: None
694
+ - `ddp_broadcast_buffers`: False
695
+ - `dataloader_pin_memory`: True
696
+ - `dataloader_persistent_workers`: False
697
+ - `skip_memory_metrics`: True
698
+ - `use_legacy_prediction_loop`: False
699
+ - `push_to_hub`: False
700
+ - `resume_from_checkpoint`: None
701
+ - `hub_model_id`: None
702
+ - `hub_strategy`: every_save
703
+ - `hub_private_repo`: None
704
+ - `hub_always_push`: False
705
+ - `gradient_checkpointing`: False
706
+ - `gradient_checkpointing_kwargs`: None
707
+ - `include_inputs_for_metrics`: False
708
+ - `include_for_metrics`: []
709
+ - `eval_do_concat_batches`: True
710
+ - `fp16_backend`: auto
711
+ - `push_to_hub_model_id`: None
712
+ - `push_to_hub_organization`: None
713
+ - `mp_parameters`:
714
+ - `auto_find_batch_size`: False
715
+ - `full_determinism`: False
716
+ - `torchdynamo`: None
717
+ - `ray_scope`: last
718
+ - `ddp_timeout`: 1800
719
+ - `torch_compile`: False
720
+ - `torch_compile_backend`: None
721
+ - `torch_compile_mode`: None
722
+ - `include_tokens_per_second`: False
723
+ - `include_num_input_tokens_seen`: False
724
+ - `neftune_noise_alpha`: None
725
+ - `optim_target_modules`: None
726
+ - `batch_eval_metrics`: False
727
+ - `eval_on_start`: False
728
+ - `use_liger_kernel`: False
729
+ - `eval_use_gather_object`: False
730
+ - `average_tokens_across_devices`: False
731
+ - `prompts`: None
732
+ - `batch_sampler`: no_duplicates
733
+ - `multi_dataset_batch_sampler`: proportional
734
+
735
+ </details>
736
+
737
+ ### Training Logs
738
+ | Epoch | Step | Training Loss |
739
+ |:------:|:----:|:-------------:|
740
+ | 0.1285 | 100 | 1.8827 |
741
+ | 0.2571 | 200 | 0.4428 |
742
+ | 0.3856 | 300 | 0.3564 |
743
+ | 0.5141 | 400 | 0.2856 |
744
+ | 0.6427 | 500 | 0.2445 |
745
+ | 0.7712 | 600 | 0.2241 |
746
+ | 0.8997 | 700 | 0.1938 |
747
+ | 1.0283 | 800 | 0.1894 |
748
+ | 1.1568 | 900 | 0.1432 |
749
+ | 1.2853 | 1000 | 0.1432 |
750
+ | 1.4139 | 1100 | 0.1341 |
751
+ | 1.5424 | 1200 | 0.1311 |
752
+ | 1.6710 | 1300 | 0.1249 |
753
+ | 1.7995 | 1400 | 0.1227 |
754
+ | 1.9280 | 1500 | 0.1241 |
755
+ | 2.0566 | 1600 | 0.1028 |
756
+ | 2.1851 | 1700 | 0.0852 |
757
+ | 2.3136 | 1800 | 0.085 |
758
+ | 2.4422 | 1900 | 0.082 |
759
+ | 2.5707 | 2000 | 0.08 |
760
+ | 2.6992 | 2100 | 0.0824 |
761
+ | 2.8278 | 2200 | 0.0802 |
762
+ | 2.9563 | 2300 | 0.0822 |
763
+ | 3.0848 | 2400 | 0.0633 |
764
+ | 3.2134 | 2500 | 0.0615 |
765
+ | 3.3419 | 2600 | 0.0612 |
766
+ | 3.4704 | 2700 | 0.058 |
767
+ | 3.5990 | 2800 | 0.0566 |
768
+ | 3.7275 | 2900 | 0.0521 |
769
+ | 3.8560 | 3000 | 0.0548 |
770
+ | 3.9846 | 3100 | 0.0547 |
771
+ | 4.1131 | 3200 | 0.0479 |
772
+ | 4.2416 | 3300 | 0.0449 |
773
+ | 4.3702 | 3400 | 0.044 |
774
+ | 4.4987 | 3500 | 0.0439 |
775
+ | 4.6272 | 3600 | 0.0444 |
776
+ | 4.7558 | 3700 | 0.0457 |
777
+ | 4.8843 | 3800 | 0.0461 |
778
+
779
+
780
+ ### Framework Versions
781
+ - Python: 3.10.16
782
+ - Sentence Transformers: 4.1.0
783
+ - Transformers: 4.51.3
784
+ - PyTorch: 2.5.1
785
+ - Accelerate: 1.6.0
786
+ - Datasets: 2.21.0
787
+ - Tokenizers: 0.21.1
788
+
789
+ ## Citation
790
+
791
+ ### BibTeX
792
+
793
+ #### Sentence Transformers
794
+ ```bibtex
795
+ @inproceedings{reimers-2019-sentence-bert,
796
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
797
+ author = "Reimers, Nils and Gurevych, Iryna",
798
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
799
+ month = "11",
800
+ year = "2019",
801
+ publisher = "Association for Computational Linguistics",
802
+ url = "https://arxiv.org/abs/1908.10084",
803
+ }
804
+ ```
805
+
806
+ #### CachedMultipleNegativesRankingLoss
807
+ ```bibtex
808
+ @misc{gao2021scaling,
809
+ title={Scaling Deep Contrastive Learning Batch Size under Memory Limited Setup},
810
+ author={Luyu Gao and Yunyi Zhang and Jiawei Han and Jamie Callan},
811
+ year={2021},
812
+ eprint={2101.06983},
813
+ archivePrefix={arXiv},
814
+ primaryClass={cs.LG}
815
+ }
816
+ ```
817
+
818
+ <!--
819
+ ## Glossary
820
+
821
+ *Clearly define terms in order to be accessible across audiences.*
822
+ -->
823
+
824
+ <!--
825
+ ## Model Card Authors
826
+
827
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
828
+ -->
829
+
830
+ <!--
831
+ ## Model Card Contact
832
+
833
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
834
+ -->
config.json ADDED
@@ -0,0 +1,30 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "architectures": [
3
+ "BertModel"
4
+ ],
5
+ "attention_probs_dropout_prob": 0.1,
6
+ "classifier_dropout": null,
7
+ "directionality": "bidi",
8
+ "hidden_act": "gelu",
9
+ "hidden_dropout_prob": 0.1,
10
+ "hidden_size": 768,
11
+ "initializer_range": 0.02,
12
+ "intermediate_size": 3072,
13
+ "layer_norm_eps": 1e-12,
14
+ "max_position_embeddings": 512,
15
+ "model_type": "bert",
16
+ "num_attention_heads": 12,
17
+ "num_hidden_layers": 12,
18
+ "pad_token_id": 0,
19
+ "pooler_fc_size": 768,
20
+ "pooler_num_attention_heads": 12,
21
+ "pooler_num_fc_layers": 3,
22
+ "pooler_size_per_head": 128,
23
+ "pooler_type": "first_token_transform",
24
+ "position_embedding_type": "absolute",
25
+ "torch_dtype": "float32",
26
+ "transformers_version": "4.51.3",
27
+ "type_vocab_size": 2,
28
+ "use_cache": true,
29
+ "vocab_size": 119547
30
+ }
config_sentence_transformers.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "__version__": {
3
+ "sentence_transformers": "4.1.0",
4
+ "transformers": "4.51.3",
5
+ "pytorch": "2.5.1"
6
+ },
7
+ "prompts": {},
8
+ "default_prompt_name": null,
9
+ "similarity_fn_name": "cosine"
10
+ }
model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:65505bfc494e3154771dfa324d9494f58120b0e31457f80b3a8bb5ecde6efbd0
3
+ size 711436136
modules.json ADDED
@@ -0,0 +1,14 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "",
6
+ "type": "sentence_transformers.models.Transformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_Pooling",
12
+ "type": "sentence_transformers.models.Pooling"
13
+ }
14
+ ]
sentence_bert_config.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "max_seq_length": 512,
3
+ "do_lower_case": false
4
+ }
special_tokens_map.json ADDED
@@ -0,0 +1,37 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "cls_token": {
3
+ "content": "[CLS]",
4
+ "lstrip": false,
5
+ "normalized": false,
6
+ "rstrip": false,
7
+ "single_word": false
8
+ },
9
+ "mask_token": {
10
+ "content": "[MASK]",
11
+ "lstrip": false,
12
+ "normalized": false,
13
+ "rstrip": false,
14
+ "single_word": false
15
+ },
16
+ "pad_token": {
17
+ "content": "[PAD]",
18
+ "lstrip": false,
19
+ "normalized": false,
20
+ "rstrip": false,
21
+ "single_word": false
22
+ },
23
+ "sep_token": {
24
+ "content": "[SEP]",
25
+ "lstrip": false,
26
+ "normalized": false,
27
+ "rstrip": false,
28
+ "single_word": false
29
+ },
30
+ "unk_token": {
31
+ "content": "[UNK]",
32
+ "lstrip": false,
33
+ "normalized": false,
34
+ "rstrip": false,
35
+ "single_word": false
36
+ }
37
+ }
tokenizer.json ADDED
The diff for this file is too large to render. See raw diff
 
tokenizer_config.json ADDED
@@ -0,0 +1,63 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "added_tokens_decoder": {
3
+ "0": {
4
+ "content": "[PAD]",
5
+ "lstrip": false,
6
+ "normalized": false,
7
+ "rstrip": false,
8
+ "single_word": false,
9
+ "special": true
10
+ },
11
+ "100": {
12
+ "content": "[UNK]",
13
+ "lstrip": false,
14
+ "normalized": false,
15
+ "rstrip": false,
16
+ "single_word": false,
17
+ "special": true
18
+ },
19
+ "101": {
20
+ "content": "[CLS]",
21
+ "lstrip": false,
22
+ "normalized": false,
23
+ "rstrip": false,
24
+ "single_word": false,
25
+ "special": true
26
+ },
27
+ "102": {
28
+ "content": "[SEP]",
29
+ "lstrip": false,
30
+ "normalized": false,
31
+ "rstrip": false,
32
+ "single_word": false,
33
+ "special": true
34
+ },
35
+ "103": {
36
+ "content": "[MASK]",
37
+ "lstrip": false,
38
+ "normalized": false,
39
+ "rstrip": false,
40
+ "single_word": false,
41
+ "special": true
42
+ }
43
+ },
44
+ "clean_up_tokenization_spaces": false,
45
+ "cls_token": "[CLS]",
46
+ "do_lower_case": false,
47
+ "extra_special_tokens": {},
48
+ "mask_token": "[MASK]",
49
+ "max_length": 512,
50
+ "model_max_length": 512,
51
+ "pad_to_multiple_of": null,
52
+ "pad_token": "[PAD]",
53
+ "pad_token_type_id": 0,
54
+ "padding_side": "right",
55
+ "sep_token": "[SEP]",
56
+ "stride": 0,
57
+ "strip_accents": null,
58
+ "tokenize_chinese_chars": true,
59
+ "tokenizer_class": "BertTokenizer",
60
+ "truncation_side": "right",
61
+ "truncation_strategy": "longest_first",
62
+ "unk_token": "[UNK]"
63
+ }
vocab.txt ADDED
The diff for this file is too large to render. See raw diff