FRED-T5-Summarizer / README.md
Anonumous's picture
Update README.md
2b6344e verified
|
raw
history blame
No virus
2.65 kB
metadata
license: mit
language:
  - ru
pipeline_tag: summarization

FRED-T5 1.7B Summarizer

Dataset detail, model training and metrics in our paper: TUT_Dobavit

The model was trained by SberDevices.

The model is trained on a mix of open summarisation data for the Russian language and use prefix tokenen '<LM>'

Usage

import torch
from transformers import GPT2Tokenizer, T5ForConditionalGeneration 
tokenizer = GPT2Tokenizer.from_pretrained('Anonumous/FRED-T5-SUM',eos_token='</s>')
model = T5ForConditionalGeneration.from_pretrained('Anonumous/FRED-T5-SUM')
device='cuda'
model.to(device)

input_text='<LM> Сократи текст.\n В деревне, затерянной среди зелёных холмов, жил старик по имени Иван. Его жизнь протекала медленно и размеренно. Каждое утро Иван выходил на поля, чтобы заботиться о своём скромном участке земли. Он выращивал картофель и морковь, которые были его главным источником пищи. Вечера старик проводил у камина, читая книги и вспоминая молодость. Жизнь в деревне была тяжёлая, но Иван находил в ней простые радости.'
input_ids=torch.tensor([tokenizer.encode(input_text)]).to(device)
outputs=model.generate(input_ids,eos_token_id=tokenizer.eos_token_id,
                    num_beams=5,
                    min_new_tokens=17,
                    max_new_tokens=200,
                    do_sample=True,
                    no_repeat_ngram_size=4,
                    top_p=0.9)
print(tokenizer.decode(outputs[0][1:]))

# print result: Старик Иван живёт размеренной жизнью в деревне, выращивая овощи и находя радость в простых вещах.

Authors

  • Sber Devices:
    • Albina Akhmetgareeva
    • Ilia Kuleshov
    • Vlad Leschuk
    • Alexander Abramov
    • Alena Fenogenova

Cite us

@misc{zmitrovich2023family,
      title={A Family of Pretrained Transformer Language Models for Russian}, 
      author={Dmitry Zmitrovich and Alexander Abramov and Andrey Kalmykov and Maria Tikhonova and Ekaterina Taktasheva and Danil Astafurov and Mark Baushenko and Artem Snegirev and Tatiana Shavrina and Sergey Markov and Vladislav Mikhailov and Alena Fenogenova},
      year={2023},
      eprint={2309.10931},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}