max_seq_length
is there a bug in your config when I token my sentence it length is 221 and the model says IndexError: index out of range in self
and here is my code a = 'sửa_đổi bổ_sung thay_thế hoặc bãi_bỏ hủy bỏ các quy_định có liên_quan đến thủ_tục hành_chính thuộc phạm_vi chức_năng quản_lý của bộ văn_hóa thể_thao và du_lịch quy_định tại các nghị_định sau 1 nghị_định số 1002006nđ cp ngày 21 tháng 9 năm 2006 của chính_phủ quy_định chi_tiết và hướng_dẫn thi_hành một_số điều của bộ luật dân_sự luật sở_hữu trí_tuệ về quyền tác_giả và quyền liên_quan sau đây gọi là nghị_định số 1002006nđ cp 2 nghị_định số 862005nđ cp ngày 08 tháng 7 năm 2005 của chính_phủ quy_định về quản_lý và bảo_vệ di_sản văn_hóa dưới nước sau đây gọi là nghị_định số 862005nđ cp 3 nghị_định số 982010nđ cp ngày 21 tháng 9 năm 2010 của chính_phủ quy_định chi_tiết thi_hành một_số điều của luật di_sản văn_hóa và luật sửa_đổi bổ_sung một_số điều của luật di_sản văn_hóa 4 nghị_định số 922007nđ cp ngày 01 tháng 06 năm 2007 của chính_phủ quy_định chi_tiết thi_hành một_số điều của luật du_lịch sau đây gọi là nghị_định số 922007nđ cp 5 nghị_định số 022009nđ cp ngày 06 tháng 01 năm 2009 của chính_phủ quy_định về tổ_chức và hoạt_động của thư_viện tư_nhân có phục_vụ cộng_đồng sau đây gọi là nghị_định số 022009nđ cp 6 nghị_định số 1032009nđ cp ngày 06 tháng 11 năm 2009 của chính_phủ ban_hành quy_chế hoạt_động văn_hóa và kinh_doanh dịch_vụ văn_hóa công_cộng sau đây gọi là nghị_định số 1032009nđ cp'
sentences = [a]
tokenizer_sent = [tokenize(sent) for sent in sentences]
model = SentenceTransformer('dangvantuan/vietnamese-embedding')
embeddings = model.encode(tokenizer_sent)
print(embeddings.shape)