mascIT commited on
Commit
8226539
1 Parent(s): 2238a68

Create README.md

Browse files
Files changed (1) hide show
  1. README.md +34 -0
README.md ADDED
@@ -0,0 +1,34 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ language:
3
+ - it
4
+ pipeline_tag: fill-mask
5
+ library_name: transformers
6
+ widget:
7
+ - example_title: "Esempio 1"
8
+ text: "Più tardi, durante la sua carriera, la gravidanza la costrinse a cancellare le sue apparizioni programmate nell'autunno del 1935. Il 29 marzo 1936 entrò in una clinica di Londra in [MASK] della nascita del suo bimbo"
9
+ - example_title: "Esempio 2"
10
+ text: "Nella stagione 2017-2018 il Karlsruhe, allenato da Alois Schwartz, [MASK] il campionato di 3. Liga al 3º posto."
11
+ - example_title: "Esempio 3"
12
+ text: "Conchita Supervía, nome alla nascita María de la Concepción Supervía Pascual (Barcellona, 8 dicembre 1895[1] – Londra, 30 marzo 1936), è [MASK] un mezzosoprano spagnolo molto famosa nel panorama operistico europeo e statunitense, attiva anche in campo concertistico"
13
+
14
+
15
+ ---
16
+
17
+ **bertina-3M** is an italian foundational model based on bert, pretrained from scratch on 30GB of italian Wikipedia articles (10M sentences).
18
+
19
+ It has 3M parameters and uses a 512 context window size.
20
+
21
+ The project is still a work in progress, new versions will come with time.
22
+
23
+ Use it as a foundational model to be finetuned for specific italian tasks.
24
+
25
+ # Training
26
+
27
+ - epochs: 4
28
+ - lr: 4e-4
29
+ - optim: AdamW (beta_1=0.8)
30
+ - weight_decay: 1e-2
31
+
32
+ # Eval
33
+
34
+ - perplexity: 21 (it's a 11MB model!)