Danil
commited on
Commit
•
e599313
1
Parent(s):
89856b8
Create README.md
Browse files
README.md
ADDED
@@ -0,0 +1,48 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
---
|
2 |
+
language:
|
3 |
+
- ru
|
4 |
+
license: apache-2.0
|
5 |
+
inference:
|
6 |
+
parameters:
|
7 |
+
top_p: 0.9
|
8 |
+
widget:
|
9 |
+
- text: "В России может появиться новый штамм коронавируса «омикрон», что может привести к подъему заболеваемости в январе, заявил доцент кафедры инфекционных болезней РУДН Сергей Вознесенский. Он отметил, что вариант «дельта» вызывал больше летальных случаев, чем омикрон, именно на фоне «дельты» была максимальная летальность."
|
10 |
+
example_title: "Коронавирус"
|
11 |
+
- text: "Начальника штаба обороны Великобритании адмирала Тони Радакина заставили имитировать активность во время визита в ангар с тяжелым вооружением, сообщила британская пресса. В приказе говорилось, что военнослужащим было велено подбегать к автомобилям, открывать все люки, затворы, листать руководство по эксплуатации и осматриваться машины, будто проводится функциональный тест для обеспечения правильной работы оборудования."
|
12 |
+
example_title: "Британия"
|
13 |
+
- text: "Для воспроизведения музыки достаточно нажимать на кнопки клавиатуры. Каждой клавише соответствует определенный семпл — есть маракасы и футуристичные звуки, напоминающие выстрелы бластеров. Из всего многообразия можно формировать собственные паттерны и наблюдать за визуализацией с анимированными геометрическими фигурами. Что интересно, нажатием клавиши пробел можно полностью переменить оформление, цвета на экране и звучание семплов."
|
14 |
+
example_title: "Технологии"
|
15 |
+
---
|
16 |
+
## keyT5. Base (small) version
|
17 |
+
|
18 |
+
Example usage (the code returns a list with keywords. duplicates are possible):
|
19 |
+
```python
|
20 |
+
from itertools import groupby
|
21 |
+
import torch
|
22 |
+
from transformers import T5ForConditionalGeneration, T5Tokenizer
|
23 |
+
|
24 |
+
model_name = "0x7194633/keyt5-base"
|
25 |
+
tokenizer = T5Tokenizer.from_pretrained(model_name)
|
26 |
+
model = T5ForConditionalGeneration.from_pretrained(model_name)
|
27 |
+
|
28 |
+
def generate(text, **kwargs):
|
29 |
+
inputs = tokenizer(text, return_tensors='pt')
|
30 |
+
with torch.no_grad():
|
31 |
+
hypotheses = model.generate(**inputs, num_beams=5, **kwargs)
|
32 |
+
s = tokenizer.decode(hypotheses[0], skip_special_tokens=True)
|
33 |
+
s = s.replace('; ', ';').replace(' ;', ';').lower().split(';')
|
34 |
+
s = [el for el, _ in groupby(s)]
|
35 |
+
return s
|
36 |
+
|
37 |
+
|
38 |
+
article = """Reuters сообщил об отмене 3,6 тыс. авиарейсов из-за «омикрона» и погоды
|
39 |
+
Наибольшее число отмен авиарейсов 2 января пришлось на американские авиакомпании
|
40 |
+
SkyWest и Southwest, у каждой — более 400 отмененных рейсов. При этом среди
|
41 |
+
отмененных 2 января авиарейсов — более 2,1 тыс. рейсов в США. Также свыше 6400
|
42 |
+
рейсов были задержаны."""
|
43 |
+
|
44 |
+
|
45 |
+
print(generate(article, top_p=1.0, max_length=64))
|
46 |
+
|
47 |
+
# ['лабораторная диагностика', 'панкреатит', 'профилактика', 'профилактика заболеваний', 'научно-популярное', 'биотехнологии', 'здоровье']
|
48 |
+
```
|