rmihaylov commited on
Commit
f266d1f
1 Parent(s): 8e44712

Create README.md

Browse files
Files changed (1) hide show
  1. README.md +64 -0
README.md ADDED
@@ -0,0 +1,64 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ inference: false
3
+ language:
4
+ - bg
5
+ license: mit
6
+ datasets:
7
+ - oscar
8
+ - chitanka
9
+ - wikipedia
10
+ tags:
11
+ - torch
12
+ ---
13
+
14
+ # PEGASUS BASE
15
+
16
+ This model was pretrained on Bulgarian language. It was intorduced in [this paper](https://arxiv.org/pdf/1912.08777.pdf).
17
+
18
+ ## Model description
19
+
20
+ The training data is private Bulgarian text from CNN, DailyMail articles.
21
+
22
+ ## Intended uses & limitations
23
+
24
+ You can use the raw model for summarization.
25
+
26
+ ### How to use
27
+
28
+ Here is how to use this model in PyTorch:
29
+
30
+ ```python
31
+ >>> from transformers import PegasusForConditionalGeneration, AutoTokenizer
32
+ >>>
33
+ >>> model_id = "rmihaylov/pegasus-base-cnn-dailymail-bg"
34
+ >>> model = PegasusForConditionalGeneration.from_pretrained(model_id)
35
+ >>> tokenizer = AutoTokenizer.from_pretrained(model_id)
36
+ >>>
37
+ >>> text = """Лукашенко поиска още полицията "да защити работническите колективи и организации и медии от заплахите на улицата", а който от държавните медии протестира, изобщо да не се връща на работа. На граничните служби бе наредено да засилят охраната на цялата граница, "за да не се допускат в Беларус от други държави бойци, оръжие, боеприпаси, пари за финансиране на безредиците, защото виждаме, че такива пари пристигат". Министерството на отбраната трябва да следи "движението на войски на НАТО на територията на Полша и Литва, тяхното направление и замисли, които в момента виждаме - и някои от тях ни карат да се замислим - и да не се притеснява да изкарва нашите въоръжени сили и техника в направлението на тяхното придвижване". Лукашенко изрично посочи събитията в град Гродно, "защото там има по-голямо желание за дестабилизация на обстановката, отколкото в Минск". Гродно стана вчера първият по-голям град, в който властите се разбраха с протестиращите да протестират на определени места в центъра на града. Той нарече опозицията "черносотници", тласкащи страната към пропаст и унищожение, както и към сблъсък с "исторически братския руски народ". Медиите трябва специално да се активизират срещу това, заръча Лукашенко."""
38
+ >>>
39
+ >>> batch = tokenizer(src_text, truncation=True, padding="longest", return_tensors="pt", return_token_type_ids=False)
40
+ >>>
41
+ >>> inputs = {
42
+ >>> 'max_length': 150,
43
+ >>> 'min_length': 10,
44
+ >>> 'do_sample': False,
45
+ >>> 'temperature': 1.0,
46
+ >>> 'top_k': 50,
47
+ >>> 'top_p': 1.0,
48
+ >>> 'repetition_penalty': 1.0,
49
+ >>> 'no_repeat_ngram_size': 0,
50
+ >>> 'use_cache': True,
51
+ >>> 'num_beams': 2,
52
+ >>> 'length_penalty': 1.0,
53
+ >>> 'num_return_sequences': 1,
54
+ >>> 'early_stopping': False,
55
+ >>> }
56
+ >>> batch.update(inputs)
57
+ >>>
58
+ >>> summary = model.generate(**batch)
59
+ >>>
60
+ >>> tgt_text = tokenizer.batch_decode(summary, skip_special_tokens=True)
61
+ >>> print(tgt_text)
62
+
63
+ ['Лукашенко изрично посочи събитията в Гродно, "защото там има по-голямо желание за дестабилизация на обстановката, отколкото в Минск" Той нарече опозицията "черносотници", тласкащи страната към пропаст и унищожение, както и сблъсък с "исторически братския руски народ"']
64
+ ```