Matryoshka Representation Learning
Paper • 2205.13147 • Published • 27
YAML Metadata Warning:empty or missing yaml metadata in repo card
Check out the documentation for more information.
language:
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
@misc{kusupati2024matryoshka,
title={Matryoshka Representation Learning},
author={Aditya Kusupati and Gantavya Bhatt and Aniket Rege and Matthew Wallingford and Aditya Sinha and Vivek Ramanujan and William Howard-Snyder and Kaifeng Chen and Sham Kakade and Prateek Jain and Ali Farhadi},
year={2024},
eprint={2205.13147},
archivePrefix={arXiv},
primaryClass={cs.LG}
}
@misc{henderson2017efficient,
title={Efficient Natural Language Response Suggestion for Smart Reply},
author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
year={2017},
eprint={1705.00652},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
This is a sentence-transformers model finetuned from bkai-foundation-models/vietnamese-bi-encoder on the json dataset. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
SentenceTransformer(
(0): Transformer({'max_seq_length': 256, 'do_lower_case': False, 'architecture': 'RobertaModel'})
(1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("sentence_transformers_model_id")
# Run inference
sentences = [
'Ký hợp đồng lao động theo quy định mới từ 22/2/2023',
'Tôi làm hộ lý theo hợp đồng 68 tại khoa kiểm soát nhiễm khuẩn ở bệnh viện huyện. Công việc hàng ngày là xử lý đồ vải bệnh nhân và xử lý dụng cụ y tế của bệnh viện. Tôi đang hưởng lương bậc 4, hệ số 2,19. Tôi xin hỏi, theo Nghị định 111/2022/NĐ-CP, tôi có được tiếp tục làm việc và hưởng các chế độ của hợp đồng 68 nữa không hay tôi phải chuyển sang ký hợp đồng khác? Nếu chuyển sang loại hợp đồng khác thì lương và các chế độ sẽ hưởng thế nào?Bộ Nội vụ trả lời vấn đề này như sau:Khoản 1 Điều 13 Nghị định số111/2022/NĐ-CPquy định: "Người đang thực hiện các công việc hỗ trợ, phục vụ theo quy định tại khoản 1 Điều 4 Nghị định này nếu chưa chuyển sang ký hợp đồng lao động theo quy định của Nghị định số 161/2018/NĐ-CP ngày 29 tháng 11 năm 2018 của Chính phủ sửa đổi, bổ sung một số quy định về tuyển dụng công chức, viên chức, nâng ngạch công chức, thăng hạng viên chức và thực hiện chế độ hợp đồng một số loại công việc trong cơ quan hành chính nhà nước, đơn vị sự nghiệp công lập (sau đây viết tắt là Nghị định số 161/2018/NĐ-CP) và cơ quan, tổ chức, đơn vị không ký hợp đồng dịch vụ thì trong thời hạn 12 tháng kể từ ngày Nghị định này có hiệu lực, cơ quan, tổ chức, đơn vị phải chuyển sang ký hợp đồng lao động. Hợp đồng lao động ký kết phải bảo đảm quyền, lợi ích hợp pháp về tiền lương, chế độ bảo hiểm xã hội và các chế độ khác theo quy định của pháp luật. Trường hợp một trong các bên không có nhu cầu thì giải quyết chế độ thôi việc theo quy định của pháp luật".Như vậy, trường hợp bà Trần Thị Hoa nếu chưa chuyển sang ký hợp đồng lao động theo quy định của Nghị định số161/2018/NĐ-CPthì trong thời hạn 12 tháng kể từ ngày Nghị định số 111/2022/NĐ-CP có hiệu lực phải chuyển sang ký hợp đồng lao động. Tiền lương và các chế độ khác của người lao động thực hiện theo quy định tại khoản 2 Điều 8 Nghị định số 111/2022/NĐ-CP.',
'Tôi xin hỏi, công ty có 100% vốn đầu tư nước ngoài có được phép mua hoặc nhận chuyển nhượng hoặc nhận cho tặng đối với nhà và đất (ngoài khu công nghiệp) từ cá nhân, tổ chức Việt Nam tại Việt Nam hay không? Nếu được thì công ty có được đứng tên trên giấy tờ nhà và đất hay không? Thời hạn đứng tên là bao lâu?Bộ Xây dựng trả lời vấn đề này như sau:Theo quy định tại Khoản 2, Điều 76 Nghị định số99/2015/NĐ-CPngày 20/10/2015 của Chính phủ quy định chi tiết và hướng dẫn thi hành một số điều củaLuật Nhà ởthì công ty 100% vốn nước ngoài đang hoạt động tại Việt Nam nếu thuộc diện được sở hữu nhà ở tại Việt Nam thì chỉ được mua nhà ở thương mại trong dự án đầu tư xây dựng nhà ở của chủ đầu tư dự án hoặc mua lại nhà ở của cá nhân, tổ chức nước ngoài đã mua nhà ở tại Việt Nam; được nhận tặng cho, nhận thừa kế nhà ở của hộ gia đình, cá nhân hoặc nhận tặng cho nhà ở của tổ chức trong dự án đầu tư xây dựng nhà ở được phép sở hữu theo quy định.Công ty 100% vốn nước ngoài đang hoạt động tại Việt Nam không được mua nhà ở của hộ gia đình, cá nhân Việt Nam; không được mua nhà ở của tổ chức Việt Nam mà không phải là chủ đầu tư dự án, không được nhận tặng cho, nhận thừa kế nhà ở ngoài các dự án đầu tư xây dựng nhà ở.Thời hạn sở hữu nhà căn cứ Giấy chứng nhận đầu tưCông ty 100% vốn nước ngoài đang hoạt động tại Việt Nam nếu mua nhà ở theo đúng quy định của Luật Nhà ở năm 2014 và Nghị định số 99/2015/NĐ-CP thì sẽ được cấp Giấy chứng nhận quyền sử dụng đất, quyền sở hữu nhà ở và tài sản khác gắn liền với đất đối với nhà ở đã mua.Theo quy định tại Điểm d, Khoản 2, Điều 161 Luật Nhà ở năm 2014 và Điều 77 Nghị định số 99/2015/NĐ-CP thì công ty 100% vốn nước ngoài đang hoạt động tại Việt Nam nếu mua nhà ở tại Việt Nam sẽ được sở hữu nhà ở tối đa bằng thời hạn ghi trong Giấy chứng nhận đầu tư cấp cho công ty; trước khi hết thời hạn sở hữu nhà ở mà công ty được tiếp tục gia hạn Giấy chứng nhận đầu tư và có nhu cầu gia hạn thời hạn sở hữu nhà ở thì được gia hạn thêm một lần tối đa bằng với thời hạn của Giấy chứng nhận đầu tư đã được gia hạn.',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities)
# tensor([[ 1.0000, 0.3432, -0.0565],
# [ 0.3432, 1.0000, -0.0176],
# [-0.0565, -0.0176, 1.0000]])