autoevaluator's picture
Add evaluation results on the samsum config and test split of samsum
79d9631
|
raw
history blame
No virus
5.06 kB
---
language:
- hu
tags:
- summarization
license: gpl
metrics:
- rouge
widget:
- text: "A Tisza-parti v\xE1ros \xE1llatkertj\xE9ben r\xE9g\xF3ta tartanak szurik\xE1\
t\xE1kat ( Suricata suricatta ) , de tavaly tavaszig nem siker\xFClt szapor\xED\
tani \u0151ket , annak ellen\xE9re , hogy t\xE1gas h\xE1z \xE9s kifut\xF3 \xE9\
p\xFClt sz\xE1mukra - k\xF6z\xF6lte Veprik R\xF3bert igazgat\xF3 . 2010-ben alakult\
\ ki az \xFAj - h\xE1rom Amszterdamb\xF3l sz\xE1rmaz\xF3 n\u0151st\xE9nyb\u0151\
l \xE9s egy budapesti fiatal h\xEDmb\u0151l \xE1ll\xF3 - csapat , amely szaporodni\
\ kezdett . 2011-ben h\xE1rom , id\xE9n pedig egy ut\xF3ddal \xF6rvendeztett\xE9\
k meg a gondoz\xF3kat \xE9s az \xE1llatbar\xE1tokat . A szurik\xE1t\xE1k ut\xF3\
dai - tizenegy hetes vemhess\xE9g ut\xE1n - okt\xF3ber \xE9s m\xE1rcius k\xF6\
z\xF6tt vakon \xE9s sz\u0151rtelen\xFCl j\xF6nnek a vil\xE1gra . A kicsinyek h\xE1\
romhetesen b\xFAjnak el\u0151 az \xFCregb\u0151l , \xE9s nevel\xE9s\xFCkben mindk\xE9\
t sz\xFCl\u0151 r\xE9szt vesz . A szurik\xE1tacsapatokban a csal\xE1d tagjai nagyon\
\ szoros kapcsolatban \xE1llnak egym\xE1ssal , viszont nagyon harciasan fell\xE9\
pnek az idegenekkel szemben , ak\xE1r meg is \xF6lhetik azt az \xE1llatot , amelyet\
\ betolakod\xF3nak tekintenek . B\xE1r a D\xE9l-Afrik\xE1ban , a Kalah\xE1ri sivatagban\
\ \u0151shonos cibetmacskaf\xE9le ragadoz\xF3kat a szegedi \xE1llatkertben term\xE9\
szetes \xE9l\u0151hely\xFCkh\xF6z k\xE9pest kevesebb vesz\xE9ly fenyegeti , a\
\ vadasparki erd\u0151ben ragadoz\xF3 madarak is \xE9lnek , amelyek ak\xE1r zs\xE1\
km\xE1nyk\xE9nt is tekinthetn\xE9nek a szurik\xE1t\xE1kra . A szegedi csapatn\xE1\
l azonban szigor\xFA \u0151rs\xE9g van , mindig lesi valaki k\xE9t l\xE1bra \xE1\
llva a vesz\xE9lyforr\xE1sokat . Az \u0151rszemek figyelm\xE9t m\xE9g a s\xE1\
rk\xE1nyrep\xFCl\u0151k is felkeltik , \xE9s felbukkan\xE1sakor valamennyi egyed\
\ biztos helyre menek\xFCl . A szurik\xE1t\xE1k a Kalah\xE1ri sivatag boz\xF3\
tos , szikl\xE1s ter\xFCletein csapatokban \xE9lnek . A 700 gramm k\xF6r\xFCli\
\ testt\xF6meg\u0171 ragadoz\xF3k rovarokkal , l\xE1rv\xE1kkal , skorpi\xF3kkal\
\ t\xE1pl\xE1lkoznak , de n\xE9ha elfogyasztj\xE1k a kisebb gerinceseket , toj\xE1\
sokat \xE9s n\xF6v\xE9nyi gum\xF3kat is . A nappal akt\xEDv \xE1llatok f\xF6ldalatti\
\ \xFCregrendszert \xE1snak , amelynek t\xF6bb bej\xE1rata is van . Ha a szurik\xE1\
t\xE1k idegen csapattal vagy ragadoz\xF3val ker\xFClnek szembe , azonnal elkezdenek\
\ \xE1sni , nagy porfelh\u0151t kavarva . Az is gyakorta el\u0151fordul , hogy\
\ szorosan egym\xE1shoz b\xFAjnak , felborzolj\xE1k sz\u0151r\xFCket , megny\xFA\
jtj\xE1k test\xFCket , hogy min\xE9l nagyobbnak l\xE1tsz\xF3djanak . Az el\u0151\
ad\xE1suk cs\xFAcspontj\xE1n pedig az eg\xE9sz csapat a leveg\u0151be ugrik ,\
\ k\xF6zben pedig morog . A hangad\xE1s egy\xE9bk\xE9nt is fontos a szurik\xE1\
t\xE1k kapcsolat\xE1ban , az egyedek legal\xE1bb t\xEDzf\xE9le jelz\xE9st haszn\xE1\
lnak a kol\xF3ni\xE1n bel\xFCl ."
model-index:
- name: NYTK/summarization-hi-bart-base-1024-hungarian
results:
- task:
type: summarization
name: Summarization
dataset:
name: samsum
type: samsum
config: samsum
split: test
metrics:
- name: ROUGE-1
type: rouge
value: 3.3361
verified: true
- name: ROUGE-2
type: rouge
value: 0.2197
verified: true
- name: ROUGE-L
type: rouge
value: 3.1465
verified: true
- name: ROUGE-LSUM
type: rouge
value: 3.2128
verified: true
- name: loss
type: loss
value: 10.159417152404785
verified: true
- name: gen_len
type: gen_len
value: 19.6984
verified: true
---
# Hungarian Abstractive Summarization BART model
For further models, scripts and details, see [our repository](https://github.com/nytud/neural-models) or [our demo site](https://juniper.nytud.hu/demo/nlp).
- BART base model (see Results Table - bold):
- Pretrained on Webcorpus 2.0
- Finetuned HI corpus (hvg.hu + index.hu)
- Segments: 559.162
## Limitations
- tokenized input text (tokenizer: [HuSpaCy](https://huggingface.co/huspacy))
- **max_source_length = 1024**
- max_target_length = 256
## Results
| Model | HI | NOL |
| ------------- | ------------- | ------------- |
| BART-base-512 | 30.18/13.86/22.92 | 46.48/32.40/39.45 |
| BART-base-1024| **31.86/14.59/23.79** | 47.01/32.91/39.97 |
## Citation
If you use this model, please cite the following paper:
```
@inproceedings {yang-bart,
title = {{BARTerezzünk! - Messze, messze, messze a világtól, - BART kísérleti modellek magyar nyelvre}},
booktitle = {XVIII. Magyar Számítógépes Nyelvészeti Konferencia},
year = {2022},
publisher = {Szegedi Tudományegyetem, Informatikai Intézet},
address = {Szeged, Magyarország},
author = {{Yang Zijian Győző}},
pages = {15--29}
}
```