|
--- |
|
language: |
|
- hu |
|
tags: |
|
- summarization |
|
license: gpl |
|
metrics: |
|
- rouge |
|
widget: |
|
- text: "A Tisza-parti v\xE1ros \xE1llatkertj\xE9ben r\xE9g\xF3ta tartanak szurik\xE1\ |
|
t\xE1kat ( Suricata suricatta ) , de tavaly tavaszig nem siker\xFClt szapor\xED\ |
|
tani \u0151ket , annak ellen\xE9re , hogy t\xE1gas h\xE1z \xE9s kifut\xF3 \xE9\ |
|
p\xFClt sz\xE1mukra - k\xF6z\xF6lte Veprik R\xF3bert igazgat\xF3 . 2010-ben alakult\ |
|
\ ki az \xFAj - h\xE1rom Amszterdamb\xF3l sz\xE1rmaz\xF3 n\u0151st\xE9nyb\u0151\ |
|
l \xE9s egy budapesti fiatal h\xEDmb\u0151l \xE1ll\xF3 - csapat , amely szaporodni\ |
|
\ kezdett . 2011-ben h\xE1rom , id\xE9n pedig egy ut\xF3ddal \xF6rvendeztett\xE9\ |
|
k meg a gondoz\xF3kat \xE9s az \xE1llatbar\xE1tokat . A szurik\xE1t\xE1k ut\xF3\ |
|
dai - tizenegy hetes vemhess\xE9g ut\xE1n - okt\xF3ber \xE9s m\xE1rcius k\xF6\ |
|
z\xF6tt vakon \xE9s sz\u0151rtelen\xFCl j\xF6nnek a vil\xE1gra . A kicsinyek h\xE1\ |
|
romhetesen b\xFAjnak el\u0151 az \xFCregb\u0151l , \xE9s nevel\xE9s\xFCkben mindk\xE9\ |
|
t sz\xFCl\u0151 r\xE9szt vesz . A szurik\xE1tacsapatokban a csal\xE1d tagjai nagyon\ |
|
\ szoros kapcsolatban \xE1llnak egym\xE1ssal , viszont nagyon harciasan fell\xE9\ |
|
pnek az idegenekkel szemben , ak\xE1r meg is \xF6lhetik azt az \xE1llatot , amelyet\ |
|
\ betolakod\xF3nak tekintenek . B\xE1r a D\xE9l-Afrik\xE1ban , a Kalah\xE1ri sivatagban\ |
|
\ \u0151shonos cibetmacskaf\xE9le ragadoz\xF3kat a szegedi \xE1llatkertben term\xE9\ |
|
szetes \xE9l\u0151hely\xFCkh\xF6z k\xE9pest kevesebb vesz\xE9ly fenyegeti , a\ |
|
\ vadasparki erd\u0151ben ragadoz\xF3 madarak is \xE9lnek , amelyek ak\xE1r zs\xE1\ |
|
km\xE1nyk\xE9nt is tekinthetn\xE9nek a szurik\xE1t\xE1kra . A szegedi csapatn\xE1\ |
|
l azonban szigor\xFA \u0151rs\xE9g van , mindig lesi valaki k\xE9t l\xE1bra \xE1\ |
|
llva a vesz\xE9lyforr\xE1sokat . Az \u0151rszemek figyelm\xE9t m\xE9g a s\xE1\ |
|
rk\xE1nyrep\xFCl\u0151k is felkeltik , \xE9s felbukkan\xE1sakor valamennyi egyed\ |
|
\ biztos helyre menek\xFCl . A szurik\xE1t\xE1k a Kalah\xE1ri sivatag boz\xF3\ |
|
tos , szikl\xE1s ter\xFCletein csapatokban \xE9lnek . A 700 gramm k\xF6r\xFCli\ |
|
\ testt\xF6meg\u0171 ragadoz\xF3k rovarokkal , l\xE1rv\xE1kkal , skorpi\xF3kkal\ |
|
\ t\xE1pl\xE1lkoznak , de n\xE9ha elfogyasztj\xE1k a kisebb gerinceseket , toj\xE1\ |
|
sokat \xE9s n\xF6v\xE9nyi gum\xF3kat is . A nappal akt\xEDv \xE1llatok f\xF6ldalatti\ |
|
\ \xFCregrendszert \xE1snak , amelynek t\xF6bb bej\xE1rata is van . Ha a szurik\xE1\ |
|
t\xE1k idegen csapattal vagy ragadoz\xF3val ker\xFClnek szembe , azonnal elkezdenek\ |
|
\ \xE1sni , nagy porfelh\u0151t kavarva . Az is gyakorta el\u0151fordul , hogy\ |
|
\ szorosan egym\xE1shoz b\xFAjnak , felborzolj\xE1k sz\u0151r\xFCket , megny\xFA\ |
|
jtj\xE1k test\xFCket , hogy min\xE9l nagyobbnak l\xE1tsz\xF3djanak . Az el\u0151\ |
|
ad\xE1suk cs\xFAcspontj\xE1n pedig az eg\xE9sz csapat a leveg\u0151be ugrik ,\ |
|
\ k\xF6zben pedig morog . A hangad\xE1s egy\xE9bk\xE9nt is fontos a szurik\xE1\ |
|
t\xE1k kapcsolat\xE1ban , az egyedek legal\xE1bb t\xEDzf\xE9le jelz\xE9st haszn\xE1\ |
|
lnak a kol\xF3ni\xE1n bel\xFCl ." |
|
model-index: |
|
- name: NYTK/summarization-hi-bart-base-1024-hungarian |
|
results: |
|
- task: |
|
type: summarization |
|
name: Summarization |
|
dataset: |
|
name: samsum |
|
type: samsum |
|
config: samsum |
|
split: test |
|
metrics: |
|
- name: ROUGE-1 |
|
type: rouge |
|
value: 3.3361 |
|
verified: true |
|
- name: ROUGE-2 |
|
type: rouge |
|
value: 0.2197 |
|
verified: true |
|
- name: ROUGE-L |
|
type: rouge |
|
value: 3.1465 |
|
verified: true |
|
- name: ROUGE-LSUM |
|
type: rouge |
|
value: 3.2128 |
|
verified: true |
|
- name: loss |
|
type: loss |
|
value: 10.159417152404785 |
|
verified: true |
|
- name: gen_len |
|
type: gen_len |
|
value: 19.6984 |
|
verified: true |
|
--- |
|
|
|
# Hungarian Abstractive Summarization BART model |
|
|
|
For further models, scripts and details, see [our repository](https://github.com/nytud/neural-models) or [our demo site](https://juniper.nytud.hu/demo/nlp). |
|
|
|
- BART base model (see Results Table - bold): |
|
- Pretrained on Webcorpus 2.0 |
|
- Finetuned HI corpus (hvg.hu + index.hu) |
|
- Segments: 559.162 |
|
|
|
## Limitations |
|
|
|
- tokenized input text (tokenizer: [HuSpaCy](https://huggingface.co/huspacy)) |
|
- **max_source_length = 1024** |
|
- max_target_length = 256 |
|
|
|
## Results |
|
|
|
| Model | HI | NOL | |
|
| ------------- | ------------- | ------------- | |
|
| BART-base-512 | 30.18/13.86/22.92 | 46.48/32.40/39.45 | |
|
| BART-base-1024| **31.86/14.59/23.79** | 47.01/32.91/39.97 | |
|
|
|
## Citation |
|
If you use this model, please cite the following paper: |
|
|
|
``` |
|
@inproceedings {yang-bart, |
|
title = {{BARTerezzünk! - Messze, messze, messze a világtól, - BART kísérleti modellek magyar nyelvre}}, |
|
booktitle = {XVIII. Magyar Számítógépes Nyelvészeti Konferencia}, |
|
year = {2022}, |
|
publisher = {Szegedi Tudományegyetem, Informatikai Intézet}, |
|
address = {Szeged, Magyarország}, |
|
author = {{Yang Zijian Győző}}, |
|
pages = {15--29} |
|
} |
|
|
|
``` |