chieunq's picture
Update README.md
5eb9a16
|
raw
history blame
1.28 kB

Mô hình XLM-Roberta-base được fine-tune trên tập dữ liệu QA tiếng Việt UIT-vQuad.(https://arxiv.org/pdf/2009.14725.pdf) language:

  • Vietnamese

tags:

  • Question Answering (QA) for vietnamese language
  • Machine Reading Comprehension (MRC)

datasets:

  • uit-vquad

metrics:

  • EM (exact match) : 60.63
  • F1 : 79.63

How to run

from transformers import pipeline

# Replace this with your own checkpoint
model_checkpoint = "chieunq/xlm-roberta-base-finetuned-squad-2"
question_answerer = pipeline("question-answering", model=model_checkpoint)

context = """
Nhóm của chúng tôi là sinh viên năm 4 trường ĐH Công Nghệ - ĐHQG Hà Nội. Nhóm gồm 3 thành viên : Nguyễn Quang Chiều, Nguyễn Quang Huy và Nguyễn Trần Anh Đức.\
 Đây là pha Reader trong dự án cuồi kì môn Các vấn đề hiện đại trong CNTT của nhóm . 
"""
question = "3 thành viên trong nhóm gồm những ai ?"
question_answerer(question=question, context=context)

Output

{'score': 0.9928902387619019,
 'start': 98,
 'end': 158,
 'answer': 'Nguyễn Quang Chiều, Nguyễn Quang Huy và Nguyễn Trần Anh Đức.'}

Framework versions

  • Transformers 4.24.0
  • Pytorch 1.12.1+cu113
  • Datasets 2.7.0
  • Tokenizers 0.13.2