Danil commited on
Commit
e599313
1 Parent(s): 89856b8

Create README.md

Browse files
Files changed (1) hide show
  1. README.md +48 -0
README.md ADDED
@@ -0,0 +1,48 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ language:
3
+ - ru
4
+ license: apache-2.0
5
+ inference:
6
+ parameters:
7
+ top_p: 0.9
8
+ widget:
9
+ - text: "В России может появиться новый штамм коронавируса «омикрон», что может привести к подъему заболеваемости в январе, заявил доцент кафедры инфекционных болезней РУДН Сергей Вознесенский. Он отметил, что вариант «дельта» вызывал больше летальных случаев, чем омикрон, именно на фоне «дельты» была максимальная летальность."
10
+ example_title: "Коронавирус"
11
+ - text: "Начальника штаба обороны Великобритании адмирала Тони Радакина заставили имитировать активность во время визита в ангар с тяжелым вооружением, сообщила британская пресса. В приказе говорилось, что военнослужащим было велено подбегать к автомобилям, открывать все люки, затворы, листать руководство по эксплуатации и осматриваться машины, будто проводится функциональный тест для обеспечения правильной работы оборудования."
12
+ example_title: "Британия"
13
+ - text: "Для воспроизведения музыки достаточно нажимать на кнопки клавиатуры. Каждой клавише соответствует определенный семпл — есть маракасы и футуристичные звуки, напоминающие выстрелы бластеров. Из всего многообразия можно формировать собственные паттерны и наблюдать за визуализацией с анимированными геометрическими фигурами. Что интересно, нажатием клавиши пробел можно полностью переменить оформление, цвета на экране и звучание семплов."
14
+ example_title: "Технологии"
15
+ ---
16
+ ## keyT5. Base (small) version
17
+
18
+ Example usage (the code returns a list with keywords. duplicates are possible):
19
+ ```python
20
+ from itertools import groupby
21
+ import torch
22
+ from transformers import T5ForConditionalGeneration, T5Tokenizer
23
+
24
+ model_name = "0x7194633/keyt5-base"
25
+ tokenizer = T5Tokenizer.from_pretrained(model_name)
26
+ model = T5ForConditionalGeneration.from_pretrained(model_name)
27
+
28
+ def generate(text, **kwargs):
29
+ inputs = tokenizer(text, return_tensors='pt')
30
+ with torch.no_grad():
31
+ hypotheses = model.generate(**inputs, num_beams=5, **kwargs)
32
+ s = tokenizer.decode(hypotheses[0], skip_special_tokens=True)
33
+ s = s.replace('; ', ';').replace(' ;', ';').lower().split(';')
34
+ s = [el for el, _ in groupby(s)]
35
+ return s
36
+
37
+
38
+ article = """Reuters сообщил об отмене 3,6 тыс. авиарейсов из-за «омикрона» и погоды
39
+ Наибольшее число отмен авиарейсов 2 января пришлось на американские авиакомпании
40
+ SkyWest и Southwest, у каждой — более 400 отмененных рейсов. При этом среди
41
+ отмененных 2 января авиарейсов — более 2,1 тыс. рейсов в США. Также свыше 6400
42
+ рейсов были задержаны."""
43
+
44
+
45
+ print(generate(article, top_p=1.0, max_length=64))
46
+
47
+ # ['лабораторная диагностика', 'панкреатит', 'профилактика', 'профилактика заболеваний', 'научно-популярное', 'биотехнологии', 'здоровье']
48
+ ```