---
language: "vi"
tags:
- vi
- xlm-roberta
license: "MIT"
metrics:
- f1
- em

---


# XLM-RoBERTa large for QA on Vietnamese languages (also support various languages)

## Overview

- Language model: xlm-roberta-large
- Fine-tune: [deepset/xlm-roberta-large-squad2](https://huggingface.co/deepset/xlm-roberta-large-squad2)
- Language: Vietnamese
- Downstream-task: Extractive QA
- Dataset: [mailong25/bert-vietnamese-question-answering](https://github.com/mailong25/bert-vietnamese-question-answering/tree/master/dataset)
- Training data: train-v2.0.json (SQuAD 2.0 format)
- Eval data: dev-v2.0.json (SQuAD 2.0 format)
- Infrastructure: 1x Tesla P100 (Google Colab)

## Performance

Evaluated on dev-v2.0.json
```
  exact: 136 / 141
  f1: 0.9692671394799054
```

## Author

An Pham: ancs21.ps [at] gmail.com

## License

MIT