comet24082002
commited on
Commit
•
8f4086b
1
Parent(s):
b090942
Add new SentenceTransformer model.
Browse files- .gitattributes +1 -0
- 1_Pooling/config.json +10 -0
- README.md +1020 -0
- config.json +28 -0
- config_sentence_transformers.json +10 -0
- model.safetensors +3 -0
- modules.json +20 -0
- sentence_bert_config.json +4 -0
- sentencepiece.bpe.model +3 -0
- special_tokens_map.json +51 -0
- tokenizer.json +3 -0
- tokenizer_config.json +55 -0
.gitattributes
CHANGED
@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
|
|
33 |
*.zip filter=lfs diff=lfs merge=lfs -text
|
34 |
*.zst filter=lfs diff=lfs merge=lfs -text
|
35 |
*tfevents* filter=lfs diff=lfs merge=lfs -text
|
|
|
|
33 |
*.zip filter=lfs diff=lfs merge=lfs -text
|
34 |
*.zst filter=lfs diff=lfs merge=lfs -text
|
35 |
*tfevents* filter=lfs diff=lfs merge=lfs -text
|
36 |
+
tokenizer.json filter=lfs diff=lfs merge=lfs -text
|
1_Pooling/config.json
ADDED
@@ -0,0 +1,10 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"word_embedding_dimension": 1024,
|
3 |
+
"pooling_mode_cls_token": true,
|
4 |
+
"pooling_mode_mean_tokens": false,
|
5 |
+
"pooling_mode_max_tokens": false,
|
6 |
+
"pooling_mode_mean_sqrt_len_tokens": false,
|
7 |
+
"pooling_mode_weightedmean_tokens": false,
|
8 |
+
"pooling_mode_lasttoken": false,
|
9 |
+
"include_prompt": true
|
10 |
+
}
|
README.md
ADDED
@@ -0,0 +1,1020 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
---
|
2 |
+
language: []
|
3 |
+
library_name: sentence-transformers
|
4 |
+
tags:
|
5 |
+
- sentence-transformers
|
6 |
+
- sentence-similarity
|
7 |
+
- feature-extraction
|
8 |
+
- generated_from_trainer
|
9 |
+
- dataset_size:10524
|
10 |
+
- loss:SoftmaxLoss
|
11 |
+
base_model: BAAI/bge-m3
|
12 |
+
datasets: []
|
13 |
+
widget:
|
14 |
+
- source_sentence: Gói thầu mua sắm thường xuyên trị giá 100 triệu đồng có thể áp
|
15 |
+
dụng hình thức chào hàng cạnh tranh rút gọn hay không?
|
16 |
+
sentences:
|
17 |
+
- "“Điều 57. Phạm vi áp dụng chào hàng cạnh tranh\n 1. Chào hàng cạnh tranh theo\
|
18 |
+
\ quy trình thông thường áp dụng đối với gói thầu quy định tại Khoản 1 Điều 23\
|
19 |
+
\ của Luật Đấu thầu có giá trị không quá 05 tỷ đồng.\n 2. Chào hàng cạnh tranh\
|
20 |
+
\ theo quy trình rút gọn áp dụng đối với gói thầu quy định tại Điểm a Khoản 1\
|
21 |
+
\ Điều 23 của Luật Đấu thầu có giá trị không quá 500 triệu đồng, gói thầu quy\
|
22 |
+
\ định tại Điểm b và Điểm c Khoản 1 Điều 23 của Luật Đấu thầu có giá trị không\
|
23 |
+
\ quá 01 tỷ đồng, gói thầu đối với mua sắm thường xuyên có giá trị không quá 200\
|
24 |
+
\ triệu đồng.”"
|
25 |
+
- 'Cơ cấu tổ chức
|
26 |
+
|
27 |
+
1. Vụ Tổ chức cán bộ.
|
28 |
+
|
29 |
+
2. Vụ Kế hoạch, Tài chính.
|
30 |
+
|
31 |
+
3. Vụ Pháp chế.
|
32 |
+
|
33 |
+
4. Vụ Đào tạo.
|
34 |
+
|
35 |
+
5. Vụ Thi đua, Khen thưởng.
|
36 |
+
|
37 |
+
6. Vụ Khoa học, Công nghệ và Môi trường.
|
38 |
+
|
39 |
+
7. Vụ Thư viện.
|
40 |
+
|
41 |
+
8. Vụ Văn hóa dân tộc.
|
42 |
+
|
43 |
+
9. Vụ Gia đình.
|
44 |
+
|
45 |
+
10. Văn phòng Bộ.
|
46 |
+
|
47 |
+
11. Thanh tra Bộ.
|
48 |
+
|
49 |
+
12. Cục Di sản văn hóa.
|
50 |
+
|
51 |
+
13. Cục Nghệ thuật biểu diễn.
|
52 |
+
|
53 |
+
14. Cục Điện ảnh.
|
54 |
+
|
55 |
+
15. Cục Bản quyền tác giả.
|
56 |
+
|
57 |
+
16. Cục Văn hóa cơ sở.
|
58 |
+
|
59 |
+
17. Cục Hợp tác quốc tế.
|
60 |
+
|
61 |
+
18. Cục Mỹ thuật, Nhiếp ảnh và Triển lãm.
|
62 |
+
|
63 |
+
19. Tổng cục Thể dục thể thao.
|
64 |
+
|
65 |
+
20. Tổng cục Du lịch.
|
66 |
+
|
67 |
+
21. Ban Quản lý Làng Văn hóa - Du lịch các dân tộc Việt Nam.
|
68 |
+
|
69 |
+
22. Viện Văn hóa Nghệ thuật quốc gia Việt Nam.
|
70 |
+
|
71 |
+
23. Báo Văn hóa.
|
72 |
+
|
73 |
+
24. Tạp chí Văn hóa Nghệ thuật.
|
74 |
+
|
75 |
+
25. Trung tâm Công nghệ thông tin.
|
76 |
+
|
77 |
+
26. Trường Cán bộ quản lý văn hóa, thể thao và du lịch.
|
78 |
+
|
79 |
+
Các đơn vị quy định từ khoản 1 đến khoản 21 Điều này là các đơn vị hành chính
|
80 |
+
giúp Bộ trưởng thực hiện chức năng quản lý nhà nước, các đơn vị quy định từ khoản
|
81 |
+
22 đến khoản 26 Điều này là các đơn vị sự nghiệp phục vụ chức năng quản lý nhà
|
82 |
+
nước của Bộ.
|
83 |
+
|
84 |
+
Bộ trưởng Bộ Văn hóa, Thể thao và Du lịch trình Thủ tướng Chính phủ ban hành các
|
85 |
+
quyết định quy định chức năng, nhiệm vụ, quyền hạn và cơ cấu tổ chức của Tổng
|
86 |
+
cục Thể dục thể thao, Tổng cục Du lịch và Ban Quản lý Làng Văn hóa - Du lịch các
|
87 |
+
dân tộc Việt Nam và quyết định ban hành danh sách các đơn vị sự nghiệp khác hiện
|
88 |
+
có thuộc Bộ.
|
89 |
+
|
90 |
+
Bộ trưởng Bộ Văn hóa, Thể thao và Du lịch quy định chức năng, nhiệm vụ, quyền
|
91 |
+
hạn và cơ cấu tổ chức của các cơ quan, đơn Vị thuộc Bộ, trừ các đơn vị quy định
|
92 |
+
tại các khoản 19, 20 và 21 Điều này.
|
93 |
+
|
94 |
+
Vụ Khoa học, Công nghệ và Môi trường, Vụ Tổ chức cán bộ, Vụ Pháp chế có 03 phòng;
|
95 |
+
Vụ Kế hoạch, Tài chính có 07 phòng; Thanh tra Bộ có 05 phòng; Văn phòng Bộ có
|
96 |
+
09 phòng.
|
97 |
+
|
98 |
+
Cục Di sản văn hóa, Cục Điện ảnh, Cục Hợp tác quốc tế, Cục Mỹ thuật, Nhiếp ảnh
|
99 |
+
và Triển lãm có văn phòng và 04 phòng.
|
100 |
+
|
101 |
+
Cục Nghệ thuật biểu diễn có văn phòng và 05 phòng.
|
102 |
+
|
103 |
+
Cục Bản quyền tác giả có văn phòng và 06 phòng.
|
104 |
+
|
105 |
+
Cục Văn hóa cơ sở có văn phòng và 08 phòng.'
|
106 |
+
- 'Điều kiện đăng ký thường trú
|
107 |
+
|
108 |
+
...
|
109 |
+
|
110 |
+
2. Công dân được đăng ký thường trú tại chỗ ở hợp pháp không thuộc quyền sở hữu
|
111 |
+
của mình khi được chủ hộ và chủ sở hữu chỗ ở hợp pháp đó đồng ý trong các trường
|
112 |
+
hợp sau đây:
|
113 |
+
|
114 |
+
a) Vợ về ở với chồng; chồng về ở với vợ; con về ở với cha, mẹ; cha, mẹ về ở với
|
115 |
+
con;
|
116 |
+
|
117 |
+
b) Người cao tuổi về ở với anh ruột, chị ruột, em ruột, cháu ruột; người khuyết
|
118 |
+
tật đặc biệt nặng, người khuyết tật nặng, người không có khả năng lao động, người
|
119 |
+
bị bệnh tâm thần hoặc bệnh khác làm mất khả năng nhận thức, khả năng điều khiển
|
120 |
+
hành vi về ở với ông nội, bà nội, ông ngoại, bà ngoại, anh ruột, chị ruột, em
|
121 |
+
ruột, bác ruột, chú ruột, cậu ruột, cô ruột, dì ruột, cháu ruột, người giám hộ;
|
122 |
+
|
123 |
+
c) Người chưa thành niên được cha, mẹ hoặc người giám hộ đồng ý hoặc không còn
|
124 |
+
cha, mẹ về ở với cụ nội, cụ ngoại, ông nội, bà nội, ông ngoại, bà ngoại, anh ruột,
|
125 |
+
chị ruột, em ruột, bác ruột, chú ruột, cậu ruột, cô ruột, dì ruột; người chưa
|
126 |
+
thành niên về ở với người giám hộ.
|
127 |
+
|
128 |
+
...
|
129 |
+
|
130 |
+
7. Việc đăng ký thường trú của người chưa thành niên phải được sự đồng ý của cha,
|
131 |
+
mẹ hoặc người giám hộ, trừ trường hợp nơi cư trú của người chưa thành niên do
|
132 |
+
Tòa án quyết định.
|
133 |
+
|
134 |
+
8. Công dân không được đăng ký thường trú mới tại chỗ ở quy định tại Điều 23 của
|
135 |
+
Luật này, trừ trường hợp quy định tại điểm a khoản 2 Điều này.'
|
136 |
+
- source_sentence: Hồ sơ thay đổi thông tin đăng ký thuế gồm những thành phần nào?
|
137 |
+
sentences:
|
138 |
+
- '“1. Trung thành với Tổ quốc, Nhân dân và Hiến pháp, phấn đấu thực hiện công cuộc
|
139 |
+
đổi mới, vì mục tiêu dân giàu, nước mạnh, dân chủ, công bằng, văn minh.
|
140 |
+
|
141 |
+
“1a. Có một quốc tịch là quốc tịch Việt Nam.” Điều này được bổ sung bởi Khoản
|
142 |
+
1 Điều 1 Luật Tổ chức Quốc hội sửa đổi 2020 có hiệu lực từ ngày 01/01/2021.”
|
143 |
+
|
144 |
+
2. Có phẩm chất đạo đức tốt, cần, kiệm, liêm, chính, chí công vô tư, gương mẫu
|
145 |
+
chấp hành pháp luật; có bản lĩnh, kiên quyết đấu tranh chống tham nhũng, lãng
|
146 |
+
phí, mọi biểu hiện quan liêu, hách dịch, cửa quyền và các hành vi vi phạm pháp
|
147 |
+
luật khác.
|
148 |
+
|
149 |
+
3. Có trình độ văn hóa, chuyên môn, có đủ năng lực, sức khỏe, kinh nghiệm công
|
150 |
+
tác và uy tín để thực hiện nhiệm vụ đại biểu Quốc hội.
|
151 |
+
|
152 |
+
4. Liên hệ chặt chẽ với Nhân dân, lắng nghe ý kiến của Nhân dân, được Nhân dân
|
153 |
+
tín nhiệm.
|
154 |
+
|
155 |
+
5. Có điều kiện tham gia các hoạt động của Quốc hội.”'
|
156 |
+
- 'Ngôn ngữ, hình thức của điều ước quốc tế
|
157 |
+
|
158 |
+
1. Điều ước quốc tế hai bên phải có văn bản bằng tiếng Việt, trừ trường hợp có
|
159 |
+
thỏa thuận khác với bên ký kết nước ngoài.
|
160 |
+
|
161 |
+
2. Trong trường hợp điều ước quốc tế được ký kết bằng nhiều thứ tiếng thì các
|
162 |
+
văn bản có giá trị ngang nhau, trừ trường hợp có thỏa thuận khác với bên ký kết
|
163 |
+
nước ngoài.
|
164 |
+
|
165 |
+
3. Trong trường hợp điều ước quốc tế chỉ được ký kết bằng tiếng nước ngoài thì
|
166 |
+
trong hồ sơ đề xuất ký kết phải có bản dịch bằng tiếng Việt của điều ước quốc
|
167 |
+
tế đó.
|
168 |
+
|
169 |
+
4. Trong trường hợp nước Cộng hòa xã hội chủ nghĩa Việt Nam bảo lưu, chấp nhận
|
170 |
+
hoặc phản đối bảo lưu của bên ký kết nước ngoài, tuyên bố đối với điều ước quốc
|
171 |
+
tế nhiều bên thì trong hồ sơ trình phải có dự thảo văn bản liên quan đến bảo lưu,
|
172 |
+
tuyên bố đó bằng tiếng Việt và tiếng nước ngoài được sử dụng để thông báo cho
|
173 |
+
cơ quan lưu chiểu điều ước quốc tế nhiều bên.
|
174 |
+
|
175 |
+
5. Bản chính điều ước quốc tế hai bên của phía Việt Nam phải được in trên giấy
|
176 |
+
điều ước quốc tế, đóng bìa theo mẫu do Bộ Ngoại giao ban hành, trừ trường hợp
|
177 |
+
có thỏa thuận khác với bên ký kết nước ngoài.'
|
178 |
+
- '"Điều 6. Kế hoạch chuyển đổi Phòng công chứng
|
179 |
+
|
180 |
+
1. Đối với các tỉnh, thành phố trực thuộc Trung ương có từ 05 Phòng công chứng
|
181 |
+
trở lên thì Sở Tư pháp chủ trì, phối hợp với Sở Tài chính, Sở Nội vụ, Sở Lao động
|
182 |
+
- Thương binh và Xã hội xây dựng Kế hoạch chuyển đổi các Phòng công chứng trình
|
183 |
+
Ủy ban nhân dân tỉnh, thành phố trực thuộc Trung ương (sau đây gọi là Ủy ban nhân
|
184 |
+
dân cấp tỉnh) phê duyệt.
|
185 |
+
|
186 |
+
Ủy ban nhân dân cấp tỉnh quyết định phê duyệt Kế hoạch chuyển đổi các Phòng công
|
187 |
+
chứng. Trong trường hợp cần thiết thì lấy ý kiến bằng văn bản của Bộ Tư pháp trước
|
188 |
+
khi quyết định.
|
189 |
+
|
190 |
+
2. Kế hoạch chuyển đổi các Phòng công chứng bao gồm các nội dung chủ yếu sau đây:
|
191 |
+
|
192 |
+
a) Sự cần thiết chuyển đổi các Phòng công chứng;
|
193 |
+
|
194 |
+
b) Số lượng các Phòng công chứng thuộc trường hợp chuyển đổi theo quy định tại
|
195 |
+
Điều 5 của Nghị định này;
|
196 |
+
|
197 |
+
c) Lộ trình chuyển đổi các Phòng công chứng;
|
198 |
+
|
199 |
+
d) Trách nhiệm tổ chức thực hiện Kế hoạch.
|
200 |
+
|
201 |
+
3. Căn cứ vào Kế hoạch chuy��n đổi các Phòng công chứng đã được Ủy ban nhân dân
|
202 |
+
cấp tỉnh phê duyệt, Sở Tư pháp phối hợp với Sở Tài chính, Sở Nội vụ, Sở Lao động
|
203 |
+
- Thương binh và Xã hội xây dựng Đề án chuyển đổi đối với từng Phòng công chứng
|
204 |
+
theo trình tự, thủ tục quy định tại Điều 7 của Nghị định này.
|
205 |
+
|
206 |
+
Đối với các tỉnh, thành phố trực thuộc Trung ương có dưới 05 Phòng công chứng
|
207 |
+
thì không cần thiết phải xây dựng Kế hoạch chuyển đổi mà xây dựng ngay Đề án chuyển
|
208 |
+
đổi từng Phòng công chứng theo quy định tại Điều 7 của Nghị định này."'
|
209 |
+
- source_sentence: Dự án nào được quyền chuyển nhượng dự án đầu tư trong khu công
|
210 |
+
nghiệp?
|
211 |
+
sentences:
|
212 |
+
- 'Quyền và nghĩa vụ của thương nhân xuất khẩu, nhập khẩu LPG/LNG/CNG
|
213 |
+
|
214 |
+
1. Thương nhân xuất khẩu, nhập khẩu LPG/LNG/CNG được thực hiện theo phương án
|
215 |
+
kinh doanh của thương nhân và phải bảo đảm chất lượng LPG/LNG/CNG xuất khẩu, nhập
|
216 |
+
khẩu theo quy định.
|
217 |
+
|
218 |
+
2. Được ủy quyền bằng văn bản cho chi nhánh hoặc công ty con bán LPG/LNG/CNG vào
|
219 |
+
khu phi thuế quan.
|
220 |
+
|
221 |
+
3. Được tổ chức mua, bán LPG/LNG/CNG và LPG chai theo hợp đồng với thương nhân
|
222 |
+
có Giấy chứng nhận đủ điều kiện còn hiệu lực và khách hàng công nghiệp.
|
223 |
+
|
224 |
+
4. Quy định giá bán LPG/LNG/CNG và LPG chai cho thương nhân thuộc hệ thống mình
|
225 |
+
quản lý.
|
226 |
+
|
227 |
+
5. Tổ chức thực hiện dịch vụ và cung ứng các dịch vụ cho thuê: kho chứa, cảng
|
228 |
+
xuất, nhập, giao nhận, phương tiện vận chuyển LPG/LNG/CNG.
|
229 |
+
|
230 |
+
6. Được thiết lập hệ thống phân phối kinh doanh khí theo quy định của Luật thương
|
231 |
+
mại.
|
232 |
+
|
233 |
+
7. Kiểm tra, giám sát hệ thống phân phối do thương nhân quản lý tuân thủ các quy
|
234 |
+
định của Nghị định này.
|
235 |
+
|
236 |
+
8. Liên đới chịu trách nhiệm đối với các hành vi vi phạm của hệ thống phân phối
|
237 |
+
do thương nhân quản lý trong hoạt động kinh doanh khí theo quy định của pháp luật.
|
238 |
+
|
239 |
+
9. Quản lý số lượng chai LPG thuộc sở hữu của thương nhân.
|
240 |
+
|
241 |
+
10. Tổ chức bán lẻ LPG và LPG chai trong hệ thống phân phối do thương nhân quản
|
242 |
+
lý, bán trực tiếp cho khách hàng sử dụng và niêm yết công khai giá bán lẻ.
|
243 |
+
|
244 |
+
11. Thực hiện kiểm định theo quy định các chai LPG, bồn chứa LPG/LNG/CNG; thiết
|
245 |
+
bị phụ trợ dùng LPG, thiết bị phụ trợ kinh doanh LNG/CNG thuộc sở hữu thương nhân.
|
246 |
+
|
247 |
+
12. Kiểm tra chất lượng, bảo dưỡng và thay thế các chai LPG, thiết bị phụ trợ
|
248 |
+
dùng LPG/LNG/CNG, bảo đảm an toàn cho khách hàng sử dụng.
|
249 |
+
|
250 |
+
13. Phải xây dựng, áp dụng, duy trì hệ thống quản lý chất lượng đối với sản phẩm
|
251 |
+
khí.
|
252 |
+
|
253 |
+
14. Thông báo bằng văn bản tới các đơn vị trong hệ thống phân phối và Sở Công
|
254 |
+
Thương, Sở Tài chính nơi có hệ thống phân phối của thương nhân khi có sự thay
|
255 |
+
đổi về giá bán LPG.
|
256 |
+
|
257 |
+
15. Tuân thủ các quy định của pháp luật về đăng ký nhãn hiệu hàng hóa.
|
258 |
+
|
259 |
+
16. Tuân thủ các quy định về quản lý an toàn, phòng cháy và chữa cháy, quản lý
|
260 |
+
đo lường, chất lượng trong hoạt động kinh doanh khí quy định tại Nghị định này
|
261 |
+
và pháp luật có liên quan.
|
262 |
+
|
263 |
+
17. Phải thực hiện công bố tiêu chuẩn áp dụng đối với sản phẩm khí do mình nhập
|
264 |
+
khẩu. Trường hợp, thương nhân xuất khẩu, nhập khẩu có thực hiện pha chế khí, trong
|
265 |
+
đó có sử dụng phụ gia để pha chế khí thì thương nhân phải thông báo về Bộ Khoa
|
266 |
+
học và Công nghệ tiêu chuẩn của phụ gia và cam kết bảo đảm chất lượng phụ gia
|
267 |
+
không ảnh hưởng đến an toàn cho người, động vật, thực vật, môi trường và chất
|
268 |
+
lượng khí.
|
269 |
+
|
270 |
+
18. Trước 30 tháng 3 hàng năm có trách nhiệm báo cáo hệ thống phân phối, nhãn
|
271 |
+
hiệu hàng hóa, hoạt động xuất khẩu, nhập khẩu và mua bán khí trên thị trường đến
|
272 |
+
Bộ Công Thương.
|
273 |
+
|
274 |
+
19. Lập sổ theo dõi hoặc cơ sở dữ liệu điện tử ứng dụng công nghệ thông tin theo
|
275 |
+
dõi LPG chai bán cho thương nhân kinh doanh LPG khác hoặc khách hàng sử dụng.
|
276 |
+
Tại sổ theo dõi hoặc cơ sở dữ liệu điện tử phải có các thông tin sau về LPG chai:
|
277 |
+
chủ sở hữu, loại chai, số sê ri chai, hạn kiểm định trên chai, tên và địa chỉ
|
278 |
+
thương nhân mua LPG chai, khách hàng sử dụng, ngày giao nhận LPG chai.'
|
279 |
+
- 'Quyền đăng ký sở hữu công nghiệp theo các điều ước quốc tế
|
280 |
+
|
281 |
+
1. Tổ chức, cá nhân nước ngoài đáp ứng các điều kiện để được bảo hộ quyền sở hữu
|
282 |
+
công nghiệp tại Việt Nam quy định tại Điều 2 của Nghị định này có thể nộp đơn
|
283 |
+
đăng ký sở hữu công nghiệp tại Việt Nam theo các điều ước quốc tế về hoặc liên
|
284 |
+
quan đến thủ tục nộp đơn quốc tế.
|
285 |
+
|
286 |
+
2. Tổ chức, cá nhân Việt Nam có thể nộp đơn đăng ký quốc tế sở hữu công nghiệp
|
287 |
+
để yêu cầu bảo hộ quyền của mình tại Việt Nam nếu điều ước quốc tế có quy định.'
|
288 |
+
- '“Điều 118. Điều kiện của nhà ở tham gia giao dịch
|
289 |
+
|
290 |
+
1. Giao dịch về mua bán, cho thuê mua, tặng cho, đổi, thế chấp, góp vốn bằng nhà
|
291 |
+
ở thì nhà ở phải có đủ điều kiện sau đây:
|
292 |
+
|
293 |
+
a) Có Giấy chứng nhận theo quy định của pháp luật, trừ trường hợp quy định tại
|
294 |
+
khoản 2 Điều này;
|
295 |
+
|
296 |
+
b) Không thuộc diện đang có tranh chấp, khiếu nại, khiếu kiện về quyền sở hữu;
|
297 |
+
đang trong thời hạn sở hữu nhà ở đối với trường hợp sở hữu nhà ở có thời hạn;
|
298 |
+
|
299 |
+
c) Không bị kê biên để thi hành án hoặc không bị kê biên để chấp hành quyết định
|
300 |
+
hành chính đã có hiệu lực pháp luật của cơ quan nhà nước có thẩm quyền;
|
301 |
+
|
302 |
+
d) Không thuộc diện đã có quyết định thu hồi đất, có thông báo giải tỏa, phá dỡ
|
303 |
+
nhà ở của cơ quan có thẩm quyền.
|
304 |
+
|
305 |
+
Các điều kiện quy định tại điểm b và điểm c khoản này không áp dụng đối với trường
|
306 |
+
hợp mua bán, thuê mua nhà ở hình thành trong tương lai.
|
307 |
+
|
308 |
+
2. Giao dịch về nhà ở sau đây thì nhà ở không bắt buộc phải có Giấy chứng nhận:
|
309 |
+
|
310 |
+
a) Mua bán, thế chấp nhà ở hình thành trong tương lai;
|
311 |
+
|
312 |
+
b) Tổ chức thực hiện tặng cho nhà tình nghĩa, nhà tình thương;
|
313 |
+
|
314 |
+
c) Mua bán, thuê mua nhà ở thuộc sở hữu nhà nước; mua bán, thuê mua nhà ở xã hội,
|
315 |
+
nhà ở để phục vụ tái định cư không thuộc sở hữu nhà nước; bán nhà ở quy định tại
|
316 |
+
khoản 4 Điều 62 của Luật này;
|
317 |
+
|
318 |
+
d) Cho thuê, cho mượn, cho ở nhờ, ủy quyền quản lý nhà ở;
|
319 |
+
|
320 |
+
đ) Nhận thừa kế nhà ở;
|
321 |
+
|
322 |
+
e) Chuyển nhượng hợp đồng mua bán nhà ở thương mại được xây dựng trong dự án đầu
|
323 |
+
tư xây dựng nhà ở bao gồm cả trường hợp đã nhận bàn giao nhà ở từ chủ đầu tư nhưng
|
324 |
+
chưa nộp hồ sơ đề nghị cơ quan nhà nước có thẩm quyền cấp Giấy chứng nhận đối
|
325 |
+
với nhà ở đó.
|
326 |
+
|
327 |
+
Các giấy tờ chứng minh điều kiện nhà ở tham gia giao dịch quy định tại khoản này
|
328 |
+
thực hiện theo quy định của Chính phủ.
|
329 |
+
|
330 |
+
3. Trường hợp nhà ở cho thuê thì ngoài các điều kiện quy định tại các điểm b,
|
331 |
+
c và d khoản 1 Điều này, nhà ở còn phải bảo đảm chất lượng, an toàn cho bên thuê
|
332 |
+
nhà ở, có đầy đủ hệ thống điện, cấp, thoát nước, bảo đảm vệ sinh môi trường.“'
|
333 |
+
- source_sentence: Nghỉ Quốc khánh của lao động nước ngoài có được nghỉ bù khi trùng
|
334 |
+
ngày lễ Tết của Việt Nam không?
|
335 |
+
sentences:
|
336 |
+
- 'I. ĐỐI TƯỢNG PHẢI QUYẾT TOÁN THUẾ
|
337 |
+
|
338 |
+
1. Đối với cá nhân trực tiếp quyết toán với cơ quan Thuế
|
339 |
+
|
340 |
+
Cá nhân cư trú có thu nhập từ tiền lương, tiền công từ hai nơi trở lên mà không
|
341 |
+
đáp ứng điều kiện được ủy quyền quyết toán theo quy định (các trường hợp được
|
342 |
+
ủy quyền nêu tại điểm 3 mục I công văn này) thì phải trực tiếp khai quyết toán
|
343 |
+
thuế TNCN với cơ quan thuế nếu có số thuế phải nộp thêm hoặc có số thuế nộp thừa
|
344 |
+
đề nghị hoàn hoặc bù trừ vào kỳ khai thuế tiếp theo.
|
345 |
+
|
346 |
+
Cá nhân có mặt tại Việt Nam tính trong năm dương lịch đầu tiên dưới 183 ngày,
|
347 |
+
nhưng tính trong 12 tháng liên tục kể từ ngày đầu tiên có mặt tại Việt Nam là
|
348 |
+
từ 183 ngày trở lên thì năm quyết toán đầu tiên là 12 tháng liên tục kể từ ngày
|
349 |
+
đầu tiên có mặt tại Việt Nam.
|
350 |
+
|
351 |
+
Cá nhân là người nước ngoài kết thúc hợp đồng làm việc tại Việt Nam khai quyết
|
352 |
+
toán thuế với cơ quan thuế trước khi xuất cảnh. Trường hợp cá nhân chưa làm thủ
|
353 |
+
tục quyết toán thuế với cơ quan thuế thì thực hiện ủy quyền cho tổ chức trả thu
|
354 |
+
nhập hoặc tổ chức, cá nhân khác quyết toán thuế theo quy đ���nh về quyết toán thuế
|
355 |
+
đối với cá nhân. Trường hợp tổ chức trả thu nhập hoặc tổ chức, cá nhân khác nhận
|
356 |
+
ủy quyền quyết toán thì phải chịu trách nhiệm về số thuế TNCN phải nộp thêm hoặc
|
357 |
+
được hoàn trả số thuế nộp thừa của cá nhân.
|
358 |
+
|
359 |
+
Cá nhân cư trú có thu nhập từ tiền lương, tiền công được trả từ nước ngoài và
|
360 |
+
cá nhân cư trú có thu nhập từ tiền lương, tiền công được trả từ các tổ chức Quốc
|
361 |
+
tế, Đại sứ quán, Lãnh sự quán chưa khấu trừ thuế trong năm thì cá nhân phải quyết
|
362 |
+
toán trực tiếp với cơ quan thuế, nếu có số thuế phải nộp thêm hoặc có số thuế
|
363 |
+
nộp thừa đề nghị hoàn hoặc bù trừ vào kỳ khai thuế tiếp theo.
|
364 |
+
|
365 |
+
Cá nhân cư trú có thu nhập từ tiền lương, tiền công đồng thời thuộc diện xét giảm
|
366 |
+
thuế do thiên tai, hỏa hoạn, tai nạn, bệnh hiểm nghèo ảnh hưởng đến khả năng nộp
|
367 |
+
thuế thì không ủy quyền cho tổ chức, cá nhân trả thu nhập quyết toán thuế thay
|
368 |
+
mà phải trực tiếp khai quyết toán với cơ quan thuế theo quy định.'
|
369 |
+
- 'Hành vi vi phạm khác
|
370 |
+
|
371 |
+
Vi phạm một trong các trường hợp sau thì bị tước danh hiệu Dân quân tự vệ:
|
372 |
+
|
373 |
+
1. Cố ý làm hỏng vũ khí vật liệu nổ quân dụng, công cụ hỗ trợ, trang bị, phương
|
374 |
+
tiện kỹ thuật quân sự nhưng chưa đến mức truy cứu trách nhiệm hình sự.
|
375 |
+
|
376 |
+
2. Bị khởi tố bị can.
|
377 |
+
|
378 |
+
3. Bị áp dụng biện pháp đưa vào cơ sở giáo dục bắt buộc.
|
379 |
+
|
380 |
+
4. Sử dụng trái phép chất ma túy.
|
381 |
+
|
382 |
+
5. Bị áp dụng biện pháp đưa vào cơ sở cai nghiện bắt buộc.
|
383 |
+
|
384 |
+
6. Bị áp dụng biện pháp giáo dục tại xã, phường, thị trấn.'
|
385 |
+
- 'Xây dựng kế hoạch sử dụng đất hàng năm cấp huyện
|
386 |
+
|
387 |
+
1. Xác định các chỉ tiêu sử dụng đất cấp tỉnh đã phân bổ cho cấp huyện trong năm
|
388 |
+
kế hoạch và phân bổ đến từng đơn vị hành chính cấp xã.
|
389 |
+
|
390 |
+
2. Xác định nhu cầu sử dụng đất cho các ngành lĩnh vực trong năm kế hoạch và phân
|
391 |
+
bổ đến từng đơn vị hành chính cấp xã, gồm:
|
392 |
+
|
393 |
+
a) Chỉ tiêu sử dụng đất trong kế hoạch sử dụng đất năm trước chưa thực hiện hết
|
394 |
+
nhưng phải phù hợp với kinh tế - xã hội trên địa bàn cấp huyện;
|
395 |
+
|
396 |
+
b) Nhu cầu sử dụng đất của các tổ chức, hộ gia đình, cá nhân trên địa bàn cấp
|
397 |
+
huyện trên cơ sở xem xét đơn đề nghị của người có nhu cầu sử dụng đất.
|
398 |
+
|
399 |
+
3. Tổng hợp nhu cầu sử dụng đất, cân đối xác định các chỉ tiêu sử dụng đất cho
|
400 |
+
các ngành, lĩnh vực trong năm kế hoạch và phân bổ đến từng đơn vị hành chính cấp
|
401 |
+
xã.'
|
402 |
+
- source_sentence: Quy định cụ thể về ngân hàng đất nông nghiệp như thế nào?
|
403 |
+
sentences:
|
404 |
+
- 'Ngân hàng đất nông nghiệp
|
405 |
+
|
406 |
+
1. Ngân hàng đất nông nghiệp là doanh nghiệp nhà nước do Chính phủ thành lập theo
|
407 |
+
quy định của pháp luật về doanh nghiệp.
|
408 |
+
|
409 |
+
2. Ngân hàng đất nông nghiệp có chức năng tạo lập quỹ đất nông nghiệp thông qua
|
410 |
+
việc thuê quyền sử dụng đất, nhận chuyển nhượng quyền sử dụng đất, nhận ký gửi
|
411 |
+
quyền sử dụng đất nông nghiệp; cho nhà đầu tư có nhu cầu thuê, thuê lại đất để
|
412 |
+
sản xuất nông nghiệp.
|
413 |
+
|
414 |
+
3. Hoạt động của Ngân hàng đất nông nghiệp không vì mục đích lợi nhuận, được Nhà
|
415 |
+
nước bảo đảm khả năng thanh toán, được miễn thuế và các khoản phải nộp ngân sách
|
416 |
+
nhà nước.
|
417 |
+
|
418 |
+
4. Kinh phí hoạt động của Ngân hàng đất nông nghiệp được cấp từ ngân sách nhà
|
419 |
+
nước; ứng từ Quỹ phát triển đất hoặc Quỹ đầu tư phát triển, quỹ tài chính khác
|
420 |
+
được ủy thác; vay từ các tổ chức tín dụng được phép hoạt động tại Việt Nam; huy
|
421 |
+
động vốn của các tổ chức, cá nhân và các nguồn khác theo quy định của pháp luật
|
422 |
+
để thực hiện việc tạo lập quỹ đất quy định tại khoản 2 Điều này.
|
423 |
+
|
424 |
+
5. Chính phủ quy định chi tiết Điều này.'
|
425 |
+
- 'Thời điểm lập hóa đơn
|
426 |
+
|
427 |
+
1. Thời điểm lập hóa đơn đối với bán hàng hóa (bao gồm cả bán tài sản nhà nước,
|
428 |
+
tài sản tịch thu, sung quỹ nhà nước và bán hàng dự trữ quốc gia) là thời điểm
|
429 |
+
chuyển giao quyền sở hữu hoặc quyền sử dụng hàng hóa cho người mua, không phân
|
430 |
+
biệt đã thu được tiền hay chưa thu được tiền.
|
431 |
+
|
432 |
+
2. Thời điểm lập hóa đơn đối với cung cấp dịch vụ là thời điểm hoàn thành việc
|
433 |
+
cung cấp dịch vụ không phân biệt đã thu được tiền hay chưa thu được tiền. Trường
|
434 |
+
hợp người cung cấp dịch vụ có thu tiền trước hoặc trong khi cung cấp dịch vụ thì
|
435 |
+
thời điểm lập hóa đơn là thời điểm thu tiền (không bao gồm trường hợp thu tiền
|
436 |
+
đặt cọc hoặc tạm ứng để đảm bảo thực hiện hợp đồng cung cấp các dịch vụ: kế toán,
|
437 |
+
kiểm toán, tư vấn tài chính, thuế; thẩm định giá; khảo sát, thiết kế kỹ thuật;
|
438 |
+
tư vấn giám sát; lập dự án đầu tư xây dựng).
|
439 |
+
|
440 |
+
3. Trường hợp giao hàng nhiều lần hoặc bàn giao từng hạng mục, công đoạn dịch
|
441 |
+
vụ thì mỗi lần giao hàng hoặc bàn giao đều phải lập hóa đơn cho khối lượng, giá
|
442 |
+
trị hàng hóa, dịch vụ được giao tương ứng.
|
443 |
+
|
444 |
+
...
|
445 |
+
|
446 |
+
Thời điểm xác định thuế GTGT
|
447 |
+
|
448 |
+
1. Đối với bán hàng hóa là thời điểm chuyển giao quyền sở hữu hoặc quyền sử dụng
|
449 |
+
hàng hóa cho người mua, không phân biệt đã thu được tiền hay chưa thu được tiền.
|
450 |
+
|
451 |
+
...'
|
452 |
+
- '"Điều 46. Nhập tài sản riêng của vợ, chồng vào tài sản chung
|
453 |
+
|
454 |
+
1. Việc nhập tài sản riêng của vợ, chồng vào tài sản chung được thực hiện theo
|
455 |
+
thỏa thuận của vợ chồng.
|
456 |
+
|
457 |
+
2. Tài sản được nhập vào tài sản chung mà theo quy định của pháp luật, giao dịch
|
458 |
+
liên quan đến tài sản đó phải tuân theo hình thức nhất định thì thỏa thuận phải
|
459 |
+
bảo đảm hình thức đó.
|
460 |
+
|
461 |
+
3. Nghĩa vụ liên quan đến tài sản riêng đã nhập vào tài sản chung được thực hiện
|
462 |
+
bằng tài sản chung, trừ trường hợp vợ chồng có thỏa thuận khác hoặc pháp luật
|
463 |
+
có quy định khác."'
|
464 |
+
pipeline_tag: sentence-similarity
|
465 |
+
---
|
466 |
+
|
467 |
+
# SentenceTransformer based on BAAI/bge-m3
|
468 |
+
|
469 |
+
This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [BAAI/bge-m3](https://huggingface.co/BAAI/bge-m3). It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
|
470 |
+
|
471 |
+
## Model Details
|
472 |
+
|
473 |
+
### Model Description
|
474 |
+
- **Model Type:** Sentence Transformer
|
475 |
+
- **Base model:** [BAAI/bge-m3](https://huggingface.co/BAAI/bge-m3) <!-- at revision babcf60cae0a1f438d7ade582983d4ba462303c2 -->
|
476 |
+
- **Maximum Sequence Length:** 512 tokens
|
477 |
+
- **Output Dimensionality:** 1024 tokens
|
478 |
+
- **Similarity Function:** Cosine Similarity
|
479 |
+
<!-- - **Training Dataset:** Unknown -->
|
480 |
+
<!-- - **Language:** Unknown -->
|
481 |
+
<!-- - **License:** Unknown -->
|
482 |
+
|
483 |
+
### Model Sources
|
484 |
+
|
485 |
+
- **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
|
486 |
+
- **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
|
487 |
+
- **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
|
488 |
+
|
489 |
+
### Full Model Architecture
|
490 |
+
|
491 |
+
```
|
492 |
+
SentenceTransformer(
|
493 |
+
(0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: XLMRobertaModel
|
494 |
+
(1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': True, 'pooling_mode_mean_tokens': False, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
|
495 |
+
(2): Normalize()
|
496 |
+
)
|
497 |
+
```
|
498 |
+
|
499 |
+
## Usage
|
500 |
+
|
501 |
+
### Direct Usage (Sentence Transformers)
|
502 |
+
|
503 |
+
First install the Sentence Transformers library:
|
504 |
+
|
505 |
+
```bash
|
506 |
+
pip install -U sentence-transformers
|
507 |
+
```
|
508 |
+
|
509 |
+
Then you can load this model and run inference.
|
510 |
+
```python
|
511 |
+
from sentence_transformers import SentenceTransformer
|
512 |
+
|
513 |
+
# Download from the 🤗 Hub
|
514 |
+
model = SentenceTransformer("comet24082002/ft_bge_newLaw_SoftmaxLoss_V1_5epochs")
|
515 |
+
# Run inference
|
516 |
+
sentences = [
|
517 |
+
'Quy định cụ thể về ngân hàng đất nông nghiệp như thế nào?',
|
518 |
+
'Ngân hàng đất nông nghiệp\n1. Ngân hàng đất nông nghiệp là doanh nghiệp nhà nước do Chính phủ thành lập theo quy định của pháp luật về doanh nghiệp.\n2. Ngân hàng đất nông nghiệp có chức năng tạo lập quỹ đất nông nghiệp thông qua việc thuê quyền sử dụng đất, nhận chuyển nhượng quyền sử dụng đất, nhận ký gửi quyền sử dụng đất nông nghiệp; cho nhà đầu tư có nhu cầu thuê, thuê lại đất để sản xuất nông nghiệp.\n3. Hoạt động của Ngân hàng đất nông nghiệp không vì mục đích lợi nhuận, được Nhà nước bảo đảm khả năng thanh toán, được miễn thuế và các khoản phải nộp ngân sách nhà nước.\n4. Kinh phí hoạt động của Ngân hàng đất nông nghiệp được cấp từ ngân sách nhà nước; ứng từ Quỹ phát triển đất hoặc Quỹ đầu tư phát triển, quỹ tài chính khác được ủy thác; vay từ các tổ chức tín dụng được phép hoạt động tại Việt Nam; huy động vốn của các tổ chức, cá nhân và các nguồn khác theo quy định của pháp luật để thực hiện việc tạo lập quỹ đất quy định tại khoản 2 Điều này.\n5. Chính phủ quy định chi tiết Điều này.',
|
519 |
+
'Thời điểm lập hóa đơn\n1. Thời điểm lập hóa đơn đối với bán hàng hóa (bao gồm cả bán tài sản nhà nước, tài sản tịch thu, sung quỹ nhà nước và bán hàng dự trữ quốc gia) là thời điểm chuyển giao quyền sở hữu hoặc quyền sử dụng hàng hóa cho người mua, không phân biệt đã thu được tiền hay chưa thu được tiền.\n2. Thời điểm lập hóa đơn đối với cung cấp dịch vụ là thời điểm hoàn thành việc cung cấp dịch vụ không phân biệt đã thu được tiền hay chưa thu được tiền. Trường hợp người cung cấp dịch vụ có thu tiền trước hoặc trong khi cung cấp dịch vụ thì thời điểm lập hóa đơn là thời điểm thu tiền (không bao gồm trường hợp thu tiền đặt cọc hoặc tạm ứng để đảm bảo thực hiện hợp đồng cung cấp các dịch vụ: kế toán, kiểm toán, tư vấn tài chính, thuế; thẩm định giá; khảo sát, thiết kế kỹ thuật; tư vấn giám sát; lập dự án đầu tư xây dựng).\n3. Trường hợp giao hàng nhiều lần hoặc bàn giao từng hạng mục, công đoạn dịch vụ thì mỗi lần giao hàng hoặc bàn giao đều phải lập hóa đơn cho khối lượng, giá trị hàng hóa, dịch vụ được giao tương ứng.\n...\nThời điểm xác định thuế GTGT\n1. Đối với bán hàng hóa là thời điểm chuyển giao quyền sở hữu hoặc quyền sử dụng hàng hóa cho người mua, không phân biệt đã thu được tiền hay chưa thu được tiền.\n...',
|
520 |
+
]
|
521 |
+
embeddings = model.encode(sentences)
|
522 |
+
print(embeddings.shape)
|
523 |
+
# [3, 1024]
|
524 |
+
|
525 |
+
# Get the similarity scores for the embeddings
|
526 |
+
similarities = model.similarity(embeddings, embeddings)
|
527 |
+
print(similarities.shape)
|
528 |
+
# [3, 3]
|
529 |
+
```
|
530 |
+
|
531 |
+
<!--
|
532 |
+
### Direct Usage (Transformers)
|
533 |
+
|
534 |
+
<details><summary>Click to see the direct usage in Transformers</summary>
|
535 |
+
|
536 |
+
</details>
|
537 |
+
-->
|
538 |
+
|
539 |
+
<!--
|
540 |
+
### Downstream Usage (Sentence Transformers)
|
541 |
+
|
542 |
+
You can finetune this model on your own dataset.
|
543 |
+
|
544 |
+
<details><summary>Click to expand</summary>
|
545 |
+
|
546 |
+
</details>
|
547 |
+
-->
|
548 |
+
|
549 |
+
<!--
|
550 |
+
### Out-of-Scope Use
|
551 |
+
|
552 |
+
*List how the model may foreseeably be misused and address what users ought not to do with the model.*
|
553 |
+
-->
|
554 |
+
|
555 |
+
<!--
|
556 |
+
## Bias, Risks and Limitations
|
557 |
+
|
558 |
+
*What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
|
559 |
+
-->
|
560 |
+
|
561 |
+
<!--
|
562 |
+
### Recommendations
|
563 |
+
|
564 |
+
*What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
|
565 |
+
-->
|
566 |
+
|
567 |
+
## Training Details
|
568 |
+
|
569 |
+
### Training Dataset
|
570 |
+
|
571 |
+
#### Unnamed Dataset
|
572 |
+
|
573 |
+
|
574 |
+
* Size: 10,524 training samples
|
575 |
+
* Columns: <code>sentence1</code>, <code>sentence2</code>, and <code>label</code>
|
576 |
+
* Approximate statistics based on the first 1000 samples:
|
577 |
+
| | sentence1 | sentence2 | label |
|
578 |
+
|:--------|:----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|:------------------------------------------------|
|
579 |
+
| type | string | string | int |
|
580 |
+
| details | <ul><li>min: 8 tokens</li><li>mean: 24.39 tokens</li><li>max: 54 tokens</li></ul> | <ul><li>min: 23 tokens</li><li>mean: 284.45 tokens</li><li>max: 512 tokens</li></ul> | <ul><li>0: ~50.00%</li><li>1: ~50.00%</li></ul> |
|
581 |
+
* Samples:
|
582 |
+
| sentence1 | sentence2 | label |
|
583 |
+
|:-------------------------------------------------------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------|
|
584 |
+
| <code>Nguyên tắc để lựa chọn người thực hiện giám định tư pháp về hải quan trong lĩnh vực tài chính ra sao?</code> | <code>Nguyên tắc lựa chọn, phân công người, tổ chức thực hiện giám định tư pháp trong lĩnh vực tài chính<br>1. Việc lựa chọn giám định viên tư pháp, người giám định tư pháp theo vụ việc, Văn phòng giám định tư pháp, tổ chức giám định tư pháp theo vụ việc thực hiện giám định phải phù hợp với đối tượng, nội dung trưng cầu giám định, đáp ứng các quy định tại Luật Giám định tư pháp, hướng dẫn tại Thông tư này và các quy định khác của pháp luật có liên quan đến giám định tư pháp.<br>2. Việc cử cán bộ, công chức là giám định viên tư pháp, người giám định tư pháp theo vụ việc; việc phân công người của Văn phòng giám định tư pháp, tổ chức giám định tư pháp theo vụ việc thực hiện giám định phải đúng thẩm quyền, trình tự, thủ tục theo quy định của pháp luật.</code> | <code>1</code> |
|
585 |
+
| <code>Tổ trưởng Tổ kiểm toán nhà nước cần đáp ứng những tiêu chuẩn gì?</code> | <code>IV. THỐNG KÊ VIÊN TRÌNH ĐỘ CAO ĐẲNG<br>...<br>3. Tiêu chuẩn về năng lực:<br>- Nắm vững các kiến thức cơ bản về nghiệp vụ thống kê và có kỹ năng thành thạo để thực hiện tốt các nghiệp vụ chuyên môn công tác thống kê trong phạm vi được phân công;<br>- Có phương pháp tuyên truyền, vận động nhân dân tham gia vào các hoạt động thống kê, có khả năng nắm bắt và áp dụng phương pháp, công nghệ tiên tiến trong quá trình thực hiện nhiệm vụ;<br>- Có khả năng làm việc tập thể, phối hợp, giao tiếp ứng xử tốt với các tổ chức, cá nhân trong quá trình thực hiện nhiệm vụ về công tác thống kê;<br>4. Tiêu chuẩn về trình độ:<br>- Tốt nghiệp Cao đẳng chuyên ngành thống kê, nếu tốt nghiệp cao đẳng chuyên ngành khác thì phải qua khóa đào tạo nghiệp vụ thống kê theo chương trình quy định của Tổng cục Thống kê;<br>- Tốt nghiệp khóa đào tạo, bồi dưỡng kiến thức quản lý hành chính nhà nước ngạch chuyên viên và lớp bồi dưỡng kiến thức nghiệp vụ công tác Thống kê;<br>- Có trình độ B một trong năm ngoại ngữ thông dụng (Anh, Nga, Pháp, Trung, Đức);<br>- Sử dụng thành thạo máy vi tính phục vụ cho công việc chuyên môn.</code> | <code>0</code> |
|
586 |
+
| <code>Phụ cấp ưu đãi đối với viên chức chuyên môn làm việc tại Trạm Thú y nơi có phụ cấp khu vực là 0,7 được chi trả khi nào?</code> | <code>CÁCH TÍNH VÀ NGUỒN KINH PHÍ CHI TRẢ PHỤ CẤP<br>1. Cách tính<br>a) Phụ cấp ưu đãi theo nghề được tính theo mức lương ngạch, bậc hiện hưởng cộng phụ cấp chức vụ lãnh đạo, phụ cấp thâm niên vượt khung (nếu có), được xác định bằng công thức sau:<br>Phụ cấp ưu đãi theo nghề được hưởng = Mức lương tối thiểu chung x Hệ số lương theo ngạch bậc hiện hưởng + hệ số phụ cấp chức vụ lãnh đạo (nếu có) + % (quy theo hệ số) phụ cấp thâm niên vượt khung (nếu có) x Mức phụ cấp ưu đãi theo nghề được hưởng<br>b) Phụ cấp ưu đãi được trả cùng kỳ lương hàng tháng và không dùng để tính đóng, hưởng chế độ bảo hiểm xã hội, bảo hiểm y tế.<br>c) Trường hợp một công chức kiểm lâm địa bàn phụ trách nhiều xã có mức phụ cấp ưu đãi khác nhau quy định tại khoản 1, mục II Thông tư này thì được hưởng mức phụ cấp ưu đãi cao nhất.<br>d) Các đối tượng quy định tại khoản 1, mục I khi được điều động công tác đến địa bàn có mức phụ cấp cao hoặc thấp hơn mức phụ cấp đang hưởng thì được hưởng mức phụ cấp ưu đãi theo địa bàn công tác mới kể từ tháng sau liền kề với tháng có quyết định điều động công tác.<br>...</code> | <code>1</code> |
|
587 |
+
* Loss: [<code>SoftmaxLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#softmaxloss)
|
588 |
+
|
589 |
+
### Training Hyperparameters
|
590 |
+
#### Non-Default Hyperparameters
|
591 |
+
|
592 |
+
- `per_device_train_batch_size`: 4
|
593 |
+
- `learning_rate`: 2e-05
|
594 |
+
- `num_train_epochs`: 5
|
595 |
+
- `warmup_ratio`: 0.1
|
596 |
+
|
597 |
+
#### All Hyperparameters
|
598 |
+
<details><summary>Click to expand</summary>
|
599 |
+
|
600 |
+
- `overwrite_output_dir`: False
|
601 |
+
- `do_predict`: False
|
602 |
+
- `prediction_loss_only`: True
|
603 |
+
- `per_device_train_batch_size`: 4
|
604 |
+
- `per_device_eval_batch_size`: 8
|
605 |
+
- `per_gpu_train_batch_size`: None
|
606 |
+
- `per_gpu_eval_batch_size`: None
|
607 |
+
- `gradient_accumulation_steps`: 1
|
608 |
+
- `eval_accumulation_steps`: None
|
609 |
+
- `learning_rate`: 2e-05
|
610 |
+
- `weight_decay`: 0.0
|
611 |
+
- `adam_beta1`: 0.9
|
612 |
+
- `adam_beta2`: 0.999
|
613 |
+
- `adam_epsilon`: 1e-08
|
614 |
+
- `max_grad_norm`: 1.0
|
615 |
+
- `num_train_epochs`: 5
|
616 |
+
- `max_steps`: -1
|
617 |
+
- `lr_scheduler_type`: linear
|
618 |
+
- `lr_scheduler_kwargs`: {}
|
619 |
+
- `warmup_ratio`: 0.1
|
620 |
+
- `warmup_steps`: 0
|
621 |
+
- `log_level`: passive
|
622 |
+
- `log_level_replica`: warning
|
623 |
+
- `log_on_each_node`: True
|
624 |
+
- `logging_nan_inf_filter`: True
|
625 |
+
- `save_safetensors`: True
|
626 |
+
- `save_on_each_node`: False
|
627 |
+
- `save_only_model`: False
|
628 |
+
- `no_cuda`: False
|
629 |
+
- `use_cpu`: False
|
630 |
+
- `use_mps_device`: False
|
631 |
+
- `seed`: 42
|
632 |
+
- `data_seed`: None
|
633 |
+
- `jit_mode_eval`: False
|
634 |
+
- `use_ipex`: False
|
635 |
+
- `bf16`: False
|
636 |
+
- `fp16`: False
|
637 |
+
- `fp16_opt_level`: O1
|
638 |
+
- `half_precision_backend`: auto
|
639 |
+
- `bf16_full_eval`: False
|
640 |
+
- `fp16_full_eval`: False
|
641 |
+
- `tf32`: None
|
642 |
+
- `local_rank`: 0
|
643 |
+
- `ddp_backend`: None
|
644 |
+
- `tpu_num_cores`: None
|
645 |
+
- `tpu_metrics_debug`: False
|
646 |
+
- `debug`: []
|
647 |
+
- `dataloader_drop_last`: False
|
648 |
+
- `dataloader_num_workers`: 0
|
649 |
+
- `dataloader_prefetch_factor`: None
|
650 |
+
- `past_index`: -1
|
651 |
+
- `disable_tqdm`: False
|
652 |
+
- `remove_unused_columns`: True
|
653 |
+
- `label_names`: None
|
654 |
+
- `load_best_model_at_end`: False
|
655 |
+
- `ignore_data_skip`: False
|
656 |
+
- `fsdp`: []
|
657 |
+
- `fsdp_min_num_params`: 0
|
658 |
+
- `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
|
659 |
+
- `fsdp_transformer_layer_cls_to_wrap`: None
|
660 |
+
- `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True}
|
661 |
+
- `deepspeed`: None
|
662 |
+
- `label_smoothing_factor`: 0.0
|
663 |
+
- `optim`: adamw_torch
|
664 |
+
- `optim_args`: None
|
665 |
+
- `adafactor`: False
|
666 |
+
- `group_by_length`: False
|
667 |
+
- `length_column_name`: length
|
668 |
+
- `ddp_find_unused_parameters`: None
|
669 |
+
- `ddp_bucket_cap_mb`: None
|
670 |
+
- `ddp_broadcast_buffers`: False
|
671 |
+
- `dataloader_pin_memory`: True
|
672 |
+
- `dataloader_persistent_workers`: False
|
673 |
+
- `skip_memory_metrics`: True
|
674 |
+
- `use_legacy_prediction_loop`: False
|
675 |
+
- `push_to_hub`: False
|
676 |
+
- `resume_from_checkpoint`: None
|
677 |
+
- `hub_model_id`: None
|
678 |
+
- `hub_strategy`: every_save
|
679 |
+
- `hub_private_repo`: False
|
680 |
+
- `hub_always_push`: False
|
681 |
+
- `gradient_checkpointing`: False
|
682 |
+
- `gradient_checkpointing_kwargs`: None
|
683 |
+
- `include_inputs_for_metrics`: False
|
684 |
+
- `fp16_backend`: auto
|
685 |
+
- `push_to_hub_model_id`: None
|
686 |
+
- `push_to_hub_organization`: None
|
687 |
+
- `mp_parameters`:
|
688 |
+
- `auto_find_batch_size`: False
|
689 |
+
- `full_determinism`: False
|
690 |
+
- `torchdynamo`: None
|
691 |
+
- `ray_scope`: last
|
692 |
+
- `ddp_timeout`: 1800
|
693 |
+
- `torch_compile`: False
|
694 |
+
- `torch_compile_backend`: None
|
695 |
+
- `torch_compile_mode`: None
|
696 |
+
- `dispatch_batches`: None
|
697 |
+
- `split_batches`: None
|
698 |
+
- `include_tokens_per_second`: False
|
699 |
+
- `include_num_input_tokens_seen`: False
|
700 |
+
- `neftune_noise_alpha`: None
|
701 |
+
- `optim_target_modules`: None
|
702 |
+
- `batch_sampler`: batch_sampler
|
703 |
+
- `multi_dataset_batch_sampler`: proportional
|
704 |
+
|
705 |
+
</details>
|
706 |
+
|
707 |
+
### Training Logs
|
708 |
+
<details><summary>Click to expand</summary>
|
709 |
+
|
710 |
+
| Epoch | Step | Training Loss |
|
711 |
+
|:------:|:-----:|:-------------:|
|
712 |
+
| 0.0190 | 50 | 0.6915 |
|
713 |
+
| 0.0380 | 100 | 0.691 |
|
714 |
+
| 0.0570 | 150 | 0.6923 |
|
715 |
+
| 0.0760 | 200 | 0.6911 |
|
716 |
+
| 0.0950 | 250 | 0.6912 |
|
717 |
+
| 0.1140 | 300 | 0.6906 |
|
718 |
+
| 0.1330 | 350 | 0.6865 |
|
719 |
+
| 0.1520 | 400 | 0.6889 |
|
720 |
+
| 0.1710 | 450 | 0.6847 |
|
721 |
+
| 0.1900 | 500 | 0.6831 |
|
722 |
+
| 0.2090 | 550 | 0.6755 |
|
723 |
+
| 0.2281 | 600 | 0.6871 |
|
724 |
+
| 0.2471 | 650 | 0.6858 |
|
725 |
+
| 0.2661 | 700 | 0.691 |
|
726 |
+
| 0.2851 | 750 | 0.6864 |
|
727 |
+
| 0.3041 | 800 | 0.6864 |
|
728 |
+
| 0.3231 | 850 | 0.6904 |
|
729 |
+
| 0.3421 | 900 | 0.6758 |
|
730 |
+
| 0.3611 | 950 | 0.679 |
|
731 |
+
| 0.3801 | 1000 | 0.6823 |
|
732 |
+
| 0.3991 | 1050 | 0.6835 |
|
733 |
+
| 0.4181 | 1100 | 0.6963 |
|
734 |
+
| 0.4371 | 1150 | 0.7012 |
|
735 |
+
| 0.4561 | 1200 | 0.6917 |
|
736 |
+
| 0.4751 | 1250 | 0.6969 |
|
737 |
+
| 0.4941 | 1300 | 0.6971 |
|
738 |
+
| 0.5131 | 1350 | 0.6989 |
|
739 |
+
| 0.5321 | 1400 | 0.6947 |
|
740 |
+
| 0.5511 | 1450 | 0.6943 |
|
741 |
+
| 0.5701 | 1500 | 0.6942 |
|
742 |
+
| 0.5891 | 1550 | 0.6955 |
|
743 |
+
| 0.6081 | 1600 | 0.6934 |
|
744 |
+
| 0.6271 | 1650 | 0.6883 |
|
745 |
+
| 0.6461 | 1700 | 0.6991 |
|
746 |
+
| 0.6651 | 1750 | 0.6915 |
|
747 |
+
| 0.6842 | 1800 | 0.6962 |
|
748 |
+
| 0.7032 | 1850 | 0.6938 |
|
749 |
+
| 0.7222 | 1900 | 0.6935 |
|
750 |
+
| 0.7412 | 1950 | 0.6928 |
|
751 |
+
| 0.7602 | 2000 | 0.6938 |
|
752 |
+
| 0.7792 | 2050 | 0.6915 |
|
753 |
+
| 0.7982 | 2100 | 0.6968 |
|
754 |
+
| 0.8172 | 2150 | 0.691 |
|
755 |
+
| 0.8362 | 2200 | 0.693 |
|
756 |
+
| 0.8552 | 2250 | 0.6956 |
|
757 |
+
| 0.8742 | 2300 | 0.6943 |
|
758 |
+
| 0.8932 | 2350 | 0.6929 |
|
759 |
+
| 0.9122 | 2400 | 0.6944 |
|
760 |
+
| 0.9312 | 2450 | 0.6943 |
|
761 |
+
| 0.9502 | 2500 | 0.6924 |
|
762 |
+
| 0.9692 | 2550 | 0.6936 |
|
763 |
+
| 0.9882 | 2600 | 0.6928 |
|
764 |
+
| 1.0072 | 2650 | 0.694 |
|
765 |
+
| 1.0262 | 2700 | 0.6935 |
|
766 |
+
| 1.0452 | 2750 | 0.6954 |
|
767 |
+
| 1.0642 | 2800 | 0.6928 |
|
768 |
+
| 1.0832 | 2850 | 0.6945 |
|
769 |
+
| 1.1022 | 2900 | 0.6931 |
|
770 |
+
| 1.1212 | 2950 | 0.694 |
|
771 |
+
| 1.1403 | 3000 | 0.6936 |
|
772 |
+
| 1.1593 | 3050 | 0.6939 |
|
773 |
+
| 1.1783 | 3100 | 0.6942 |
|
774 |
+
| 1.1973 | 3150 | 0.6937 |
|
775 |
+
| 1.2163 | 3200 | 0.6931 |
|
776 |
+
| 1.2353 | 3250 | 0.6933 |
|
777 |
+
| 1.2543 | 3300 | 0.6951 |
|
778 |
+
| 1.2733 | 3350 | 0.6935 |
|
779 |
+
| 1.2923 | 3400 | 0.6932 |
|
780 |
+
| 1.3113 | 3450 | 0.6942 |
|
781 |
+
| 1.3303 | 3500 | 0.6943 |
|
782 |
+
| 1.3493 | 3550 | 0.6942 |
|
783 |
+
| 1.3683 | 3600 | 0.6939 |
|
784 |
+
| 1.3873 | 3650 | 0.693 |
|
785 |
+
| 1.4063 | 3700 | 0.6916 |
|
786 |
+
| 1.4253 | 3750 | 0.6927 |
|
787 |
+
| 1.4443 | 3800 | 0.6944 |
|
788 |
+
| 1.4633 | 3850 | 0.6893 |
|
789 |
+
| 1.4823 | 3900 | 0.6971 |
|
790 |
+
| 1.5013 | 3950 | 0.6952 |
|
791 |
+
| 1.5203 | 4000 | 0.6929 |
|
792 |
+
| 1.5393 | 4050 | 0.6948 |
|
793 |
+
| 1.5583 | 4100 | 0.6934 |
|
794 |
+
| 1.5773 | 4150 | 0.6922 |
|
795 |
+
| 1.5964 | 4200 | 0.6944 |
|
796 |
+
| 1.6154 | 4250 | 0.692 |
|
797 |
+
| 1.6344 | 4300 | 0.6947 |
|
798 |
+
| 1.6534 | 4350 | 0.6944 |
|
799 |
+
| 1.6724 | 4400 | 0.6932 |
|
800 |
+
| 1.6914 | 4450 | 0.6935 |
|
801 |
+
| 1.7104 | 4500 | 0.6935 |
|
802 |
+
| 1.7294 | 4550 | 0.6924 |
|
803 |
+
| 1.7484 | 4600 | 0.6915 |
|
804 |
+
| 1.7674 | 4650 | 0.692 |
|
805 |
+
| 1.7864 | 4700 | 0.695 |
|
806 |
+
| 1.8054 | 4750 | 0.6948 |
|
807 |
+
| 1.8244 | 4800 | 0.6942 |
|
808 |
+
| 1.8434 | 4850 | 0.6916 |
|
809 |
+
| 1.8624 | 4900 | 0.6928 |
|
810 |
+
| 1.8814 | 4950 | 0.694 |
|
811 |
+
| 1.9004 | 5000 | 0.6938 |
|
812 |
+
| 1.9194 | 5050 | 0.6934 |
|
813 |
+
| 1.9384 | 5100 | 0.6934 |
|
814 |
+
| 1.9574 | 5150 | 0.695 |
|
815 |
+
| 1.9764 | 5200 | 0.6935 |
|
816 |
+
| 1.9954 | 5250 | 0.694 |
|
817 |
+
| 2.0144 | 5300 | 0.6928 |
|
818 |
+
| 2.0334 | 5350 | 0.6971 |
|
819 |
+
| 2.0525 | 5400 | 0.6939 |
|
820 |
+
| 2.0715 | 5450 | 0.6926 |
|
821 |
+
| 2.0905 | 5500 | 0.6922 |
|
822 |
+
| 2.1095 | 5550 | 0.6936 |
|
823 |
+
| 2.1285 | 5600 | 0.6903 |
|
824 |
+
| 2.1475 | 5650 | 0.6982 |
|
825 |
+
| 2.1665 | 5700 | 0.6919 |
|
826 |
+
| 2.1855 | 5750 | 0.6928 |
|
827 |
+
| 2.2045 | 5800 | 0.6921 |
|
828 |
+
| 2.2235 | 5850 | 0.6948 |
|
829 |
+
| 2.2425 | 5900 | 0.6932 |
|
830 |
+
| 2.2615 | 5950 | 0.6946 |
|
831 |
+
| 2.2805 | 6000 | 0.691 |
|
832 |
+
| 2.2995 | 6050 | 0.6928 |
|
833 |
+
| 2.3185 | 6100 | 0.6956 |
|
834 |
+
| 2.3375 | 6150 | 0.6934 |
|
835 |
+
| 2.3565 | 6200 | 0.6924 |
|
836 |
+
| 2.3755 | 6250 | 0.691 |
|
837 |
+
| 2.3945 | 6300 | 0.6898 |
|
838 |
+
| 2.4135 | 6350 | 0.6925 |
|
839 |
+
| 2.4325 | 6400 | 0.694 |
|
840 |
+
| 2.4515 | 6450 | 0.6944 |
|
841 |
+
| 2.4705 | 6500 | 0.6943 |
|
842 |
+
| 2.4895 | 6550 | 0.6939 |
|
843 |
+
| 2.5086 | 6600 | 0.6936 |
|
844 |
+
| 2.5276 | 6650 | 0.6939 |
|
845 |
+
| 2.5466 | 6700 | 0.6927 |
|
846 |
+
| 2.5656 | 6750 | 0.6927 |
|
847 |
+
| 2.5846 | 6800 | 0.6942 |
|
848 |
+
| 2.6036 | 6850 | 0.6937 |
|
849 |
+
| 2.6226 | 6900 | 0.6922 |
|
850 |
+
| 2.6416 | 6950 | 0.6941 |
|
851 |
+
| 2.6606 | 7000 | 0.6938 |
|
852 |
+
| 2.6796 | 7050 | 0.6941 |
|
853 |
+
| 2.6986 | 7100 | 0.6941 |
|
854 |
+
| 2.7176 | 7150 | 0.6936 |
|
855 |
+
| 2.7366 | 7200 | 0.6942 |
|
856 |
+
| 2.7556 | 7250 | 0.6923 |
|
857 |
+
| 2.7746 | 7300 | 0.6923 |
|
858 |
+
| 2.7936 | 7350 | 0.6922 |
|
859 |
+
| 2.8126 | 7400 | 0.6944 |
|
860 |
+
| 2.8316 | 7450 | 0.6933 |
|
861 |
+
| 2.8506 | 7500 | 0.6914 |
|
862 |
+
| 2.8696 | 7550 | 0.6939 |
|
863 |
+
| 2.8886 | 7600 | 0.6942 |
|
864 |
+
| 2.9076 | 7650 | 0.6935 |
|
865 |
+
| 2.9266 | 7700 | 0.6917 |
|
866 |
+
| 2.9456 | 7750 | 0.6918 |
|
867 |
+
| 2.9647 | 7800 | 0.6934 |
|
868 |
+
| 2.9837 | 7850 | 0.6937 |
|
869 |
+
| 3.0027 | 7900 | 0.6925 |
|
870 |
+
| 3.0217 | 7950 | 0.6938 |
|
871 |
+
| 3.0407 | 8000 | 0.691 |
|
872 |
+
| 3.0597 | 8050 | 0.6918 |
|
873 |
+
| 3.0787 | 8100 | 0.6923 |
|
874 |
+
| 3.0977 | 8150 | 0.6899 |
|
875 |
+
| 3.1167 | 8200 | 0.6946 |
|
876 |
+
| 3.1357 | 8250 | 0.6904 |
|
877 |
+
| 3.1547 | 8300 | 0.6967 |
|
878 |
+
| 3.1737 | 8350 | 0.6944 |
|
879 |
+
| 3.1927 | 8400 | 0.6937 |
|
880 |
+
| 3.2117 | 8450 | 0.6934 |
|
881 |
+
| 3.2307 | 8500 | 0.6937 |
|
882 |
+
| 3.2497 | 8550 | 0.6927 |
|
883 |
+
| 3.2687 | 8600 | 0.6932 |
|
884 |
+
| 3.2877 | 8650 | 0.6925 |
|
885 |
+
| 3.3067 | 8700 | 0.6944 |
|
886 |
+
| 3.3257 | 8750 | 0.6937 |
|
887 |
+
| 3.3447 | 8800 | 0.6936 |
|
888 |
+
| 3.3637 | 8850 | 0.6925 |
|
889 |
+
| 3.3827 | 8900 | 0.6942 |
|
890 |
+
| 3.4017 | 8950 | 0.6926 |
|
891 |
+
| 3.4208 | 9000 | 0.693 |
|
892 |
+
| 3.4398 | 9050 | 0.6941 |
|
893 |
+
| 3.4588 | 9100 | 0.6908 |
|
894 |
+
| 3.4778 | 9150 | 0.6929 |
|
895 |
+
| 3.4968 | 9200 | 0.6955 |
|
896 |
+
| 3.5158 | 9250 | 0.6935 |
|
897 |
+
| 3.5348 | 9300 | 0.6938 |
|
898 |
+
| 3.5538 | 9350 | 0.6932 |
|
899 |
+
| 3.5728 | 9400 | 0.6932 |
|
900 |
+
| 3.5918 | 9450 | 0.6928 |
|
901 |
+
| 3.6108 | 9500 | 0.6936 |
|
902 |
+
| 3.6298 | 9550 | 0.6934 |
|
903 |
+
| 3.6488 | 9600 | 0.6942 |
|
904 |
+
| 3.6678 | 9650 | 0.6931 |
|
905 |
+
| 3.6868 | 9700 | 0.6935 |
|
906 |
+
| 3.7058 | 9750 | 0.6931 |
|
907 |
+
| 3.7248 | 9800 | 0.6926 |
|
908 |
+
| 3.7438 | 9850 | 0.694 |
|
909 |
+
| 3.7628 | 9900 | 0.6932 |
|
910 |
+
| 3.7818 | 9950 | 0.6923 |
|
911 |
+
| 3.8008 | 10000 | 0.6937 |
|
912 |
+
| 3.8198 | 10050 | 0.6929 |
|
913 |
+
| 3.8388 | 10100 | 0.6917 |
|
914 |
+
| 3.8578 | 10150 | 0.6936 |
|
915 |
+
| 3.8769 | 10200 | 0.6938 |
|
916 |
+
| 3.8959 | 10250 | 0.6932 |
|
917 |
+
| 3.9149 | 10300 | 0.6917 |
|
918 |
+
| 3.9339 | 10350 | 0.696 |
|
919 |
+
| 3.9529 | 10400 | 0.6942 |
|
920 |
+
| 3.9719 | 10450 | 0.6935 |
|
921 |
+
| 3.9909 | 10500 | 0.6928 |
|
922 |
+
| 4.0099 | 10550 | 0.6929 |
|
923 |
+
| 4.0289 | 10600 | 0.6935 |
|
924 |
+
| 4.0479 | 10650 | 0.6934 |
|
925 |
+
| 4.0669 | 10700 | 0.6937 |
|
926 |
+
| 4.0859 | 10750 | 0.6929 |
|
927 |
+
| 4.1049 | 10800 | 0.6934 |
|
928 |
+
| 4.1239 | 10850 | 0.6936 |
|
929 |
+
| 4.1429 | 10900 | 0.6932 |
|
930 |
+
| 4.1619 | 10950 | 0.6931 |
|
931 |
+
| 4.1809 | 11000 | 0.6925 |
|
932 |
+
| 4.1999 | 11050 | 0.6928 |
|
933 |
+
| 4.2189 | 11100 | 0.6913 |
|
934 |
+
| 4.2379 | 11150 | 0.696 |
|
935 |
+
| 4.2569 | 11200 | 0.6921 |
|
936 |
+
| 4.2759 | 11250 | 0.6934 |
|
937 |
+
| 4.2949 | 11300 | 0.6937 |
|
938 |
+
| 4.3139 | 11350 | 0.6917 |
|
939 |
+
| 4.3330 | 11400 | 0.6949 |
|
940 |
+
| 4.3520 | 11450 | 0.6929 |
|
941 |
+
| 4.3710 | 11500 | 0.6938 |
|
942 |
+
| 4.3900 | 11550 | 0.6944 |
|
943 |
+
| 4.4090 | 11600 | 0.6935 |
|
944 |
+
| 4.4280 | 11650 | 0.6932 |
|
945 |
+
| 4.4470 | 11700 | 0.6937 |
|
946 |
+
| 4.4660 | 11750 | 0.693 |
|
947 |
+
| 4.4850 | 11800 | 0.6934 |
|
948 |
+
| 4.5040 | 11850 | 0.6932 |
|
949 |
+
| 4.5230 | 11900 | 0.6926 |
|
950 |
+
| 4.5420 | 11950 | 0.6928 |
|
951 |
+
| 4.5610 | 12000 | 0.6938 |
|
952 |
+
| 4.5800 | 12050 | 0.6925 |
|
953 |
+
| 4.5990 | 12100 | 0.6946 |
|
954 |
+
| 4.6180 | 12150 | 0.6937 |
|
955 |
+
| 4.6370 | 12200 | 0.6938 |
|
956 |
+
| 4.6560 | 12250 | 0.6931 |
|
957 |
+
| 4.6750 | 12300 | 0.6929 |
|
958 |
+
| 4.6940 | 12350 | 0.6932 |
|
959 |
+
| 4.7130 | 12400 | 0.694 |
|
960 |
+
| 4.7320 | 12450 | 0.6932 |
|
961 |
+
| 4.7510 | 12500 | 0.6933 |
|
962 |
+
| 4.7700 | 12550 | 0.6935 |
|
963 |
+
| 4.7891 | 12600 | 0.6931 |
|
964 |
+
| 4.8081 | 12650 | 0.6923 |
|
965 |
+
| 4.8271 | 12700 | 0.6936 |
|
966 |
+
| 4.8461 | 12750 | 0.6939 |
|
967 |
+
| 4.8651 | 12800 | 0.6935 |
|
968 |
+
| 4.8841 | 12850 | 0.693 |
|
969 |
+
| 4.9031 | 12900 | 0.6935 |
|
970 |
+
| 4.9221 | 12950 | 0.6934 |
|
971 |
+
| 4.9411 | 13000 | 0.6922 |
|
972 |
+
| 4.9601 | 13050 | 0.6932 |
|
973 |
+
| 4.9791 | 13100 | 0.6932 |
|
974 |
+
| 4.9981 | 13150 | 0.6935 |
|
975 |
+
|
976 |
+
</details>
|
977 |
+
|
978 |
+
### Framework Versions
|
979 |
+
- Python: 3.10.13
|
980 |
+
- Sentence Transformers: 3.0.1
|
981 |
+
- Transformers: 4.39.3
|
982 |
+
- PyTorch: 2.1.2
|
983 |
+
- Accelerate: 0.29.3
|
984 |
+
- Datasets: 2.18.0
|
985 |
+
- Tokenizers: 0.15.2
|
986 |
+
|
987 |
+
## Citation
|
988 |
+
|
989 |
+
### BibTeX
|
990 |
+
|
991 |
+
#### Sentence Transformers and SoftmaxLoss
|
992 |
+
```bibtex
|
993 |
+
@inproceedings{reimers-2019-sentence-bert,
|
994 |
+
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
|
995 |
+
author = "Reimers, Nils and Gurevych, Iryna",
|
996 |
+
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
|
997 |
+
month = "11",
|
998 |
+
year = "2019",
|
999 |
+
publisher = "Association for Computational Linguistics",
|
1000 |
+
url = "https://arxiv.org/abs/1908.10084",
|
1001 |
+
}
|
1002 |
+
```
|
1003 |
+
|
1004 |
+
<!--
|
1005 |
+
## Glossary
|
1006 |
+
|
1007 |
+
*Clearly define terms in order to be accessible across audiences.*
|
1008 |
+
-->
|
1009 |
+
|
1010 |
+
<!--
|
1011 |
+
## Model Card Authors
|
1012 |
+
|
1013 |
+
*Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
|
1014 |
+
-->
|
1015 |
+
|
1016 |
+
<!--
|
1017 |
+
## Model Card Contact
|
1018 |
+
|
1019 |
+
*Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
|
1020 |
+
-->
|
config.json
ADDED
@@ -0,0 +1,28 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"_name_or_path": "BAAI/bge-m3",
|
3 |
+
"architectures": [
|
4 |
+
"XLMRobertaModel"
|
5 |
+
],
|
6 |
+
"attention_probs_dropout_prob": 0.1,
|
7 |
+
"bos_token_id": 0,
|
8 |
+
"classifier_dropout": null,
|
9 |
+
"eos_token_id": 2,
|
10 |
+
"hidden_act": "gelu",
|
11 |
+
"hidden_dropout_prob": 0.1,
|
12 |
+
"hidden_size": 1024,
|
13 |
+
"initializer_range": 0.02,
|
14 |
+
"intermediate_size": 4096,
|
15 |
+
"layer_norm_eps": 1e-05,
|
16 |
+
"max_position_embeddings": 8194,
|
17 |
+
"model_type": "xlm-roberta",
|
18 |
+
"num_attention_heads": 16,
|
19 |
+
"num_hidden_layers": 24,
|
20 |
+
"output_past": true,
|
21 |
+
"pad_token_id": 1,
|
22 |
+
"position_embedding_type": "absolute",
|
23 |
+
"torch_dtype": "float32",
|
24 |
+
"transformers_version": "4.39.3",
|
25 |
+
"type_vocab_size": 1,
|
26 |
+
"use_cache": true,
|
27 |
+
"vocab_size": 250002
|
28 |
+
}
|
config_sentence_transformers.json
ADDED
@@ -0,0 +1,10 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"__version__": {
|
3 |
+
"sentence_transformers": "3.0.1",
|
4 |
+
"transformers": "4.39.3",
|
5 |
+
"pytorch": "2.1.2"
|
6 |
+
},
|
7 |
+
"prompts": {},
|
8 |
+
"default_prompt_name": null,
|
9 |
+
"similarity_fn_name": null
|
10 |
+
}
|
model.safetensors
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:45aaee363e65e0d06092ee55a23793d77fd9babba2954709e55445fe3372bf25
|
3 |
+
size 2271064456
|
modules.json
ADDED
@@ -0,0 +1,20 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
[
|
2 |
+
{
|
3 |
+
"idx": 0,
|
4 |
+
"name": "0",
|
5 |
+
"path": "",
|
6 |
+
"type": "sentence_transformers.models.Transformer"
|
7 |
+
},
|
8 |
+
{
|
9 |
+
"idx": 1,
|
10 |
+
"name": "1",
|
11 |
+
"path": "1_Pooling",
|
12 |
+
"type": "sentence_transformers.models.Pooling"
|
13 |
+
},
|
14 |
+
{
|
15 |
+
"idx": 2,
|
16 |
+
"name": "2",
|
17 |
+
"path": "2_Normalize",
|
18 |
+
"type": "sentence_transformers.models.Normalize"
|
19 |
+
}
|
20 |
+
]
|
sentence_bert_config.json
ADDED
@@ -0,0 +1,4 @@
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"max_seq_length": 512,
|
3 |
+
"do_lower_case": false
|
4 |
+
}
|
sentencepiece.bpe.model
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:cfc8146abe2a0488e9e2a0c56de7952f7c11ab059eca145a0a727afce0db2865
|
3 |
+
size 5069051
|
special_tokens_map.json
ADDED
@@ -0,0 +1,51 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"bos_token": {
|
3 |
+
"content": "<s>",
|
4 |
+
"lstrip": false,
|
5 |
+
"normalized": false,
|
6 |
+
"rstrip": false,
|
7 |
+
"single_word": false
|
8 |
+
},
|
9 |
+
"cls_token": {
|
10 |
+
"content": "<s>",
|
11 |
+
"lstrip": false,
|
12 |
+
"normalized": false,
|
13 |
+
"rstrip": false,
|
14 |
+
"single_word": false
|
15 |
+
},
|
16 |
+
"eos_token": {
|
17 |
+
"content": "</s>",
|
18 |
+
"lstrip": false,
|
19 |
+
"normalized": false,
|
20 |
+
"rstrip": false,
|
21 |
+
"single_word": false
|
22 |
+
},
|
23 |
+
"mask_token": {
|
24 |
+
"content": "<mask>",
|
25 |
+
"lstrip": true,
|
26 |
+
"normalized": false,
|
27 |
+
"rstrip": false,
|
28 |
+
"single_word": false
|
29 |
+
},
|
30 |
+
"pad_token": {
|
31 |
+
"content": "<pad>",
|
32 |
+
"lstrip": false,
|
33 |
+
"normalized": false,
|
34 |
+
"rstrip": false,
|
35 |
+
"single_word": false
|
36 |
+
},
|
37 |
+
"sep_token": {
|
38 |
+
"content": "</s>",
|
39 |
+
"lstrip": false,
|
40 |
+
"normalized": false,
|
41 |
+
"rstrip": false,
|
42 |
+
"single_word": false
|
43 |
+
},
|
44 |
+
"unk_token": {
|
45 |
+
"content": "<unk>",
|
46 |
+
"lstrip": false,
|
47 |
+
"normalized": false,
|
48 |
+
"rstrip": false,
|
49 |
+
"single_word": false
|
50 |
+
}
|
51 |
+
}
|
tokenizer.json
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:39feb9863a378165ab9c5c689047203d789422966c0c58721c5309fd039a8edc
|
3 |
+
size 17083074
|
tokenizer_config.json
ADDED
@@ -0,0 +1,55 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"added_tokens_decoder": {
|
3 |
+
"0": {
|
4 |
+
"content": "<s>",
|
5 |
+
"lstrip": false,
|
6 |
+
"normalized": false,
|
7 |
+
"rstrip": false,
|
8 |
+
"single_word": false,
|
9 |
+
"special": true
|
10 |
+
},
|
11 |
+
"1": {
|
12 |
+
"content": "<pad>",
|
13 |
+
"lstrip": false,
|
14 |
+
"normalized": false,
|
15 |
+
"rstrip": false,
|
16 |
+
"single_word": false,
|
17 |
+
"special": true
|
18 |
+
},
|
19 |
+
"2": {
|
20 |
+
"content": "</s>",
|
21 |
+
"lstrip": false,
|
22 |
+
"normalized": false,
|
23 |
+
"rstrip": false,
|
24 |
+
"single_word": false,
|
25 |
+
"special": true
|
26 |
+
},
|
27 |
+
"3": {
|
28 |
+
"content": "<unk>",
|
29 |
+
"lstrip": false,
|
30 |
+
"normalized": false,
|
31 |
+
"rstrip": false,
|
32 |
+
"single_word": false,
|
33 |
+
"special": true
|
34 |
+
},
|
35 |
+
"250001": {
|
36 |
+
"content": "<mask>",
|
37 |
+
"lstrip": true,
|
38 |
+
"normalized": false,
|
39 |
+
"rstrip": false,
|
40 |
+
"single_word": false,
|
41 |
+
"special": true
|
42 |
+
}
|
43 |
+
},
|
44 |
+
"bos_token": "<s>",
|
45 |
+
"clean_up_tokenization_spaces": true,
|
46 |
+
"cls_token": "<s>",
|
47 |
+
"eos_token": "</s>",
|
48 |
+
"mask_token": "<mask>",
|
49 |
+
"model_max_length": 512,
|
50 |
+
"pad_token": "<pad>",
|
51 |
+
"sep_token": "</s>",
|
52 |
+
"sp_model_kwargs": {},
|
53 |
+
"tokenizer_class": "XLMRobertaTokenizer",
|
54 |
+
"unk_token": "<unk>"
|
55 |
+
}
|