File size: 2,787 Bytes
c3eeefb 3213233 21895f2 3213233 21895f2 3213233 c3eeefb 3213233 c3eeefb 3213233 c3eeefb 3213233 c3eeefb 3213233 c3eeefb 21895f2 3213233 c3eeefb 3213233 c3eeefb 3213233 c3eeefb 3213233 c3eeefb 3213233 c3eeefb 3213233 c3eeefb 3213233 c3eeefb 3213233 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 |
---
license: cc-by-nc-4.0
language:
- hu
metrics:
- accuracy
- f1
model-index:
- name: huBERTPlain
results:
- task:
type: text-classification
metrics:
- type: accuracy
value: 0.74
- type: f1
value: 0.74
widget:
- text: "Az egységes gyakorlati alkalmazás érdekében, illetve abból a célból, hogy a független kisüzemi termelői státuszt valamennyi tagállamban könnyebben elismerjék a Bizottság 2022. január 1-jével kezdődően uniós végrehajtási rendeletben határozta meg: egységes űrlap rendszeresítésével a tanúsítvány formáját, tartalmát és a kiállítására vonatkozó részlet szabályokat; a tanúsítvány meghatározott adatainak a 2008/118/EK irányelv IV. fejezete szerinti szállításához szükséges adminisztratív okmányban, azaz az Adminisztratív kísérőokmányon (NAV_VP_IE815 jelű nyomtatvány) történő szerepeltetését; a tanúsítvány meghatározott adatainak 2008/118/EK irányelv V. fejezete szerinti szállításához szükséges adminisztratív okmányban, azaz az Egyszerűsített Kísérő Okmányon (NAV_VP_HU815e jelű nyomtatvány) történő szerepeltetését."
example_title: "Incomprehensible"
- text: "Az AEO-engedély birtokosainak listáján – keresésre – megjelenő információk: az engedélyes neve, az engedélyt kibocsátó ország, az engedély típusa."
exmaple_title: "Comprehensible"
---
## Model description
Fine-tuned xlm-RoBERTa model for Hungarian, trained on a dataset provided by National Tax and Customs Administration - Hungary (NAV): Public Accessibilty Programme.
## Intended uses & limitations
The model can be used as any other xlm-RoBERTa model. It has been tested recognizing "accessible" and "original" sentences, where:
* "accessible" - "Label_1": sentence, that can be considered as comprehensible (regarding to Plain Language directives)
* "original" - "Label_0": sentence, that needs to rephrased in order to follow Plain Language Guidelines.
## Training
Fine-tuned version of the xlm-RoBERTa model (`FacebookAI/xlm-roberta-base`), trained on information materials provided by NAV linguistic experts.
## Eval results
| Class | Precision | Recall | F-Score |
|-----|------------|------------|------|
| **Original / Label_0** | **0.76** | **0.71** | **0.73**|
| **Accessible / Label_1** | **0.72** | **0.78** | **0.75**|
| **accuracy** | | | **0.74**|
| **macro avg** | **0.74** | **0.74** | **0.74**|
| **weighted avg** | **0.74** | **0.74** | **0.74**|
## Usage
```py
from transformers import AutoTokenizer, AutoModelForSequenceClassification
tokenizer = AutoTokenizer.from_pretrained("uvegesistvan/Hun_RoBERTa_Plain")
model = AutoModelForSequenceClassification.from_pretrained("uvegesistvan/Hun_RoBERTa_Plain")
```
|