julien-c HF staff commited on
Commit
f679e8b
1 Parent(s): 2b8c840

Migrate model card from transformers-repo

Browse files

Read announcement at https://discuss.huggingface.co/t/announcement-all-model-cards-will-be-migrated-to-hf-co-model-repos/2755
Original file history: https://github.com/huggingface/transformers/commits/master/model_cards/blinoff/roberta-base-russian-v0/README.md

Files changed (1) hide show
  1. README.md +61 -0
README.md ADDED
@@ -0,0 +1,61 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ language: ru
3
+ widget:
4
+ - text: "Мозг — это машина <mask>, которая пытается снизить ошибку в прогнозе."
5
+ ---
6
+
7
+ # RoBERTa-like language model trained on part of part of TAIGA corpus
8
+
9
+ ## Training Details
10
+
11
+ - about 60k steps
12
+
13
+ ![]()
14
+
15
+ ## Example pipeline
16
+
17
+ ```python
18
+ from transformers import pipeline
19
+ from transformers import RobertaTokenizerFast
20
+
21
+ tokenizer = RobertaTokenizerFast.from_pretrained('blinoff/roberta-base-russian-v0', max_len=512)
22
+
23
+ fill_mask = pipeline(
24
+ "fill-mask",
25
+ model="blinoff/roberta-base-russian-v0",
26
+ tokenizer=tokenizer
27
+ )
28
+
29
+ fill_mask("Мозг — это машина <mask>, которая пытается снизить ошибку в прогнозе.")
30
+
31
+ # {
32
+ # 'sequence': '<s>Мозг — это машина города, которая пытается снизить ошибку в прогнозе.</s>',
33
+ # 'score': 0.012859329581260681,
34
+ # 'token': 2144,
35
+ # 'token_str': 'ĠгоÑĢода'
36
+ # },
37
+ # {
38
+ # 'sequence': '<s>Мозг — это машина человека, которая пытается снизить ошибку в прогнозе.</s>',
39
+ # 'score': 0.01185101643204689,
40
+ # 'token': 1470,
41
+ # 'token_str': 'ĠÑĩеловека'
42
+ # },
43
+ # {
44
+ # 'sequence': '<s>Мозг — это машина дома, которая пытается снизить ошибку в прогнозе.</s>',
45
+ # 'score': 0.009940559044480324,
46
+ # 'token': 1411,
47
+ # 'token_str': 'Ġдома'
48
+ # },
49
+ # {
50
+ # 'sequence': '<s>Мозг — это машина женщина, которая пытается снизить ошибку в прогнозе.</s>',
51
+ # 'score': 0.007794599514454603,
52
+ # 'token': 2707,
53
+ # 'token_str': 'ĠженÑīина'
54
+ # },
55
+ # {
56
+ # 'sequence': '<s>Мозг — это машина женщины, которая пытается снизить ошибку в прогнозе.</s>',
57
+ # 'score': 0.007725382689386606,
58
+ # 'token': 3546,
59
+ # 'token_str': 'ĠженÑīинÑĭ'
60
+ # }
61
+ ```