TalTechNLP
/

mBART-ERRnews

Text2Text Generation

Inference Endpoints

Model card Files Files and versions Community

henryharm commited on Dec 6, 2022

Commit

7d40a0e

•

1 Parent(s): c7af39a

Update README.md

Files changed (1) hide show

README.md +4 -1

README.md CHANGED Viewed

@@ -14,10 +14,13 @@ Here is how to use this model to get a summary of a given text in PyTorch:
 ```python
 from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
 tokenizer = AutoTokenizer.from_pretrained("TalTechNLP/mBART-ERRnews")
 model = AutoModelForSeq2SeqLM.from_pretrained("TalTechNLP/mBART-ERRnews")
 text = "Riigikogu rahanduskomisjon võttis esmaspäeval maha riigieelarvesse esitatud investeeringuettepanekutest siseministeeriumi investeeringud koolidele ja lasteaedadele, sest komisjoni hinnangul ei peaks siseministeerium tegelema investeeringutega väljaspoole oma vastutusala. Komisjoni esimees Aivar Kokk ütles, et komisjon lähtus otsuse tegemisel riigikontrolör Janar Holmi soovitusest ja seadustest."
 inputs = tokenizer(text, return_tensors='pt', max_length=1024)
 summary_ids = model.generate(inputs['input_ids'])
 summary = [tokenizer.decode(g, skip_special_tokens=True, clean_up_tokenization_spaces=False) for g in summary_ids]
 ```
@@ -30,7 +33,7 @@ Estonian news story transcripts and summaries.
 ### Training
 The model was trained on 2 cloud GPUs with a batch size of 16 for 16 epochs. The optimizer
-used is Adam with a learning rate of 5e-05, \\(\beta_{1} = 0.9\\) and \\(\beta_{2} = 0.999\\).
 ## Evaluation results

 ```python
 from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
 tokenizer = AutoTokenizer.from_pretrained("TalTechNLP/mBART-ERRnews")
 model = AutoModelForSeq2SeqLM.from_pretrained("TalTechNLP/mBART-ERRnews")
 text = "Riigikogu rahanduskomisjon võttis esmaspäeval maha riigieelarvesse esitatud investeeringuettepanekutest siseministeeriumi investeeringud koolidele ja lasteaedadele, sest komisjoni hinnangul ei peaks siseministeerium tegelema investeeringutega väljaspoole oma vastutusala. Komisjoni esimees Aivar Kokk ütles, et komisjon lähtus otsuse tegemisel riigikontrolör Janar Holmi soovitusest ja seadustest."
 inputs = tokenizer(text, return_tensors='pt', max_length=1024)
 summary_ids = model.generate(inputs['input_ids'])
 summary = [tokenizer.decode(g, skip_special_tokens=True, clean_up_tokenization_spaces=False) for g in summary_ids]
 ```
 ### Training
 The model was trained on 2 cloud GPUs with a batch size of 16 for 16 epochs. The optimizer
+used is Adam with a learning rate of 5e-05, betas of 0.9 and 0.999.
 ## Evaluation results