machineuser
Automatic correction of README.md metadata for keys. Contact website@huggingface.co for any question
99ede8b
metadata
language: vi
tags:
- vi
- xlm-roberta
widget:
- text: Toà nhà nào cao nhất Việt Nam?
context: >-
Landmark 81 là một toà nhà chọc trời trong tổ hợp dự án Vinhomes Tân Cảng,
một dự án có tổng mức đầu tư 40.000 tỷ đồng, do Công ty Cổ phần Đầu tư xây
dựng Tân Liên Phát thuộc Vingroup làm chủ đầu tư. Toà tháp cao 81 tầng,
hiện tại là toà nhà cao nhất Việt Nam và là toà nhà cao nhất Đông Nam Á từ
tháng 3 năm 2018.
license: mit
metrics:
- f1
- em
XLM-RoBERTa large for QA on Vietnamese languages (also support various languages)
Overview
- Language model: xlm-roberta-large
- Fine-tune: deepset/xlm-roberta-large-squad2
- Language: Vietnamese
- Downstream-task: Extractive QA
- Dataset: mailong25/bert-vietnamese-question-answering
- Training data: train-v2.0.json (SQuAD 2.0 format)
- Eval data: dev-v2.0.json (SQuAD 2.0 format)
- Infrastructure: 1x Tesla P100 (Google Colab)
Performance
Evaluated on dev-v2.0.json
exact: 136 / 141
f1: 0.9692671394799054
Evaluated on Vietnamese XQuAD: xquad.vi.json
exact: 604 / 1190
f1: 0.7224454217571596
Author
An Pham (ancs21.ps [at] gmail.com)
License
MIT