Safetensors
roberta

YAML Metadata Warning:empty or missing yaml metadata in repo card

Check out the documentation for more information.


language:

  • vi license: apache-2.0 tags:
  • sentence-transformers
  • sentence-similarity
  • feature-extraction
  • dense
  • generated_from_trainer
  • dataset_size:57371
  • loss:MatryoshkaLoss
  • loss:MultipleNegativesRankingLoss base_model: bkai-foundation-models/vietnamese-bi-encoder
  • The bold row denotes the saved checkpoint.

Framework Versions

  • Python: 3.12.12
  • Sentence Transformers: 5.2.3
  • Transformers: 5.0.0
  • PyTorch: 2.10.0+cu128
  • Accelerate: 1.12.0
  • Datasets: 4.8.3
  • Tokenizers: 0.22.2

Citation

BibTeX

Sentence Transformers

@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}

MatryoshkaLoss

@misc{kusupati2024matryoshka,
    title={Matryoshka Representation Learning},
    author={Aditya Kusupati and Gantavya Bhatt and Aniket Rege and Matthew Wallingford and Aditya Sinha and Vivek Ramanujan and William Howard-Snyder and Kaifeng Chen and Sham Kakade and Prateek Jain and Ali Farhadi},
    year={2024},
    eprint={2205.13147},
    archivePrefix={arXiv},
    primaryClass={cs.LG}
}

MultipleNegativesRankingLoss

@misc{henderson2017efficient,
    title={Efficient Natural Language Response Suggestion for Smart Reply},
    author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
    year={2017},
    eprint={1705.00652},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}

embedding_supper_legal

This is a sentence-transformers model finetuned from bkai-foundation-models/vietnamese-bi-encoder on the json dataset. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.

Model Details

Model Description

  • Model Type: Sentence Transformer
  • Base model: bkai-foundation-models/vietnamese-bi-encoder
  • Maximum Sequence Length: 256 tokens
  • Output Dimensionality: 768 dimensions
  • Similarity Function: Cosine Similarity
  • Training Dataset:
    • json
  • Language: vi
  • License: apache-2.0

Model Sources

Full Model Architecture

SentenceTransformer(
  (0): Transformer({'max_seq_length': 256, 'do_lower_case': False, 'architecture': 'RobertaModel'})
  (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)

Usage

Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

pip install -U sentence-transformers

Then you can load this model and run inference.

from sentence_transformers import SentenceTransformer

# Download from the 🤗 Hub
model = SentenceTransformer("sentence_transformers_model_id")
# Run inference
sentences = [
    'Ký hợp đồng lao động theo quy định mới từ 22/2/2023',
    'Tôi làm hộ lý theo hợp đồng 68 tại khoa kiểm soát nhiễm khuẩn ở bệnh viện huyện. Công việc hàng ngày là xử lý đồ vải bệnh nhân và xử lý dụng cụ y tế của bệnh viện. Tôi đang hưởng lương bậc 4, hệ số 2,19. Tôi xin hỏi, theo Nghị định 111/2022/NĐ-CP, tôi có được tiếp tục làm việc và hưởng các chế độ của hợp đồng 68 nữa không hay tôi phải chuyển sang ký hợp đồng khác? Nếu chuyển sang loại hợp đồng khác thì lương và các chế độ sẽ hưởng thế nào?Bộ Nội vụ trả lời vấn đề này như sau:Khoản 1 Điều 13 Nghị định số111/2022/NĐ-CPquy định: "Người đang thực hiện các công việc hỗ trợ, phục vụ theo quy  định tại khoản 1 Điều 4 Nghị định này nếu chưa chuyển sang ký hợp đồng  lao động theo quy định của Nghị định số 161/2018/NĐ-CP ngày 29 tháng 11  năm 2018 của Chính phủ sửa đổi, bổ sung một số quy định về tuyển dụng  công chức, viên chức, nâng ngạch công chức, thăng hạng viên chức và thực  hiện chế độ hợp đồng một số loại công việc trong cơ quan hành chính nhà  nước, đơn vị sự nghiệp công lập (sau đây viết tắt là Nghị định số  161/2018/NĐ-CP) và cơ quan, tổ chức, đơn vị không ký hợp đồng dịch vụ  thì trong thời hạn 12 tháng kể từ ngày Nghị định này có hiệu lực, cơ  quan, tổ chức, đơn vị phải chuyển sang ký hợp đồng lao động. Hợp đồng  lao động ký kết phải bảo đảm quyền, lợi ích hợp pháp về tiền lương, chế  độ bảo hiểm xã hội và các chế độ khác theo quy định của pháp luật.  Trường hợp một trong các bên không có nhu cầu thì giải quyết chế độ thôi  việc theo quy định của pháp luật".Như vậy, trường hợp bà Trần Thị Hoa nếu chưa chuyển sang ký hợp đồng lao động theo quy định của Nghị định số161/2018/NĐ-CPthì trong thời hạn 12 tháng kể từ ngày Nghị định số 111/2022/NĐ-CP có  hiệu lực phải chuyển sang ký hợp đồng lao động. Tiền lương và các chế độ  khác của người lao động thực hiện theo quy định tại khoản 2 Điều 8 Nghị  định số 111/2022/NĐ-CP.',
    'Tôi xin hỏi, công ty có 100% vốn đầu tư nước ngoài có được phép mua hoặc nhận chuyển nhượng hoặc nhận cho tặng đối với nhà và đất (ngoài khu công nghiệp) từ cá nhân, tổ chức Việt Nam tại Việt Nam hay không? Nếu được thì công ty có được đứng tên trên giấy tờ nhà và đất hay không? Thời hạn đứng tên là bao lâu?Bộ Xây dựng trả lời vấn đề này như sau:Theo quy định tại Khoản 2, Điều 76 Nghị định số99/2015/NĐ-CPngày 20/10/2015 của Chính phủ quy định chi tiết và hướng dẫn thi hành một số điều củaLuật Nhà ởthì công ty 100% vốn nước ngoài đang hoạt động tại Việt Nam nếu thuộc diện được sở hữu nhà ở tại Việt Nam thì chỉ được mua nhà ở thương mại trong dự án đầu tư xây dựng nhà ở của chủ đầu tư dự án hoặc mua lại nhà ở của cá nhân, tổ chức nước ngoài đã mua nhà ở tại Việt Nam; được nhận tặng cho, nhận thừa kế nhà ở của hộ gia đình, cá nhân hoặc nhận tặng cho nhà ở của tổ chức trong dự án đầu tư xây dựng nhà ở được phép sở hữu theo quy định.Công ty 100% vốn nước ngoài đang hoạt động tại Việt Nam không được mua nhà ở của hộ gia đình, cá nhân Việt Nam; không được mua nhà ở của tổ chức Việt Nam mà không phải là chủ đầu tư dự án, không được nhận tặng cho, nhận thừa kế nhà ở ngoài các dự án đầu tư xây dựng nhà ở.Thời hạn sở hữu nhà căn cứ Giấy chứng nhận đầu tưCông ty 100% vốn nước ngoài đang hoạt động tại Việt Nam nếu mua nhà ở theo đúng quy định của Luật Nhà ở năm 2014 và Nghị định số 99/2015/NĐ-CP thì sẽ được cấp Giấy chứng nhận quyền sử dụng đất, quyền sở hữu nhà ở và tài sản khác gắn liền với đất đối với nhà ở đã mua.Theo quy định tại Điểm d, Khoản 2, Điều 161 Luật Nhà ở năm 2014 và Điều 77 Nghị định số 99/2015/NĐ-CP thì công ty 100% vốn nước ngoài đang hoạt động tại Việt Nam nếu mua nhà ở tại Việt Nam sẽ được sở hữu nhà ở tối đa bằng thời hạn ghi trong Giấy chứng nhận đầu tư cấp cho công ty; trước khi hết thời hạn sở hữu nhà ở mà công ty được tiếp tục gia hạn Giấy chứng nhận đầu tư và có nhu cầu gia hạn thời hạn sở hữu nhà ở thì được gia hạn thêm một lần tối đa bằng với thời hạn của Giấy chứng nhận đầu tư đã được gia hạn.',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]

# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities)
# tensor([[ 1.0000,  0.3432, -0.0565],
#         [ 0.3432,  1.0000, -0.0176],
#         [-0.0565, -0.0176,  1.0000]])
Downloads last month
1
Safetensors
Model size
0.1B params
Tensor type
F32
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Papers for tanh17042004/DTA04_legal_embedding