Mô hình XLM-Roberta-base được fine-tune trên tập dữ liệu QA tiếng Việt UIT-vQuad.(https://arxiv.org/pdf/2009.14725.pdf) language: - Vietnamese tags: - Question Answering (QA) for vietnamese language - Machine Reading Comprehension (MRC) datasets: - uit-vquad metrics: - EM (exact match) : 60.63 - F1 : 79.63 ### How to run ``` from transformers import pipeline # Replace this with your own checkpoint model_checkpoint = "chieunq/xlm-roberta-base-finetuned-squad-2" question_answerer = pipeline("question-answering", model=model_checkpoint) context = """ Nhóm của chúng tôi là sinh viên năm 4 trường ĐH Công Nghệ - ĐHQG Hà Nội. Nhóm gồm 3 thành viên : Nguyễn Quang Chiều, Nguyễn Quang Huy và Nguyễn Trần Anh Đức.\ Đây là pha Reader trong dự án cuồi kì môn Các vấn đề hiện đại trong CNTT của nhóm . """ question = "3 thành viên trong nhóm gồm những ai ?" question_answerer(question=question, context=context) ``` ### Output ``` {'score': 0.9928902387619019, 'start': 98, 'end': 158, 'answer': 'Nguyễn Quang Chiều, Nguyễn Quang Huy và Nguyễn Trần Anh Đức.'} ``` ### Framework versions - Transformers 4.24.0 - Pytorch 1.12.1+cu113 - Datasets 2.7.0 - Tokenizers 0.13.2