Update README.md
Browse files
README.md
CHANGED
@@ -1,38 +1,88 @@
|
|
1 |
---
|
2 |
datasets:
|
3 |
- squad_it
|
|
|
|
|
4 |
language:
|
5 |
- it
|
6 |
license: apache-2.0
|
7 |
tags:
|
8 |
-
|
9 |
-
|
10 |
-
|
11 |
widget:
|
12 |
-
- text:
|
13 |
-
|
14 |
-
|
15 |
-
context:
|
16 |
-
|
17 |
-
|
18 |
-
|
19 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
20 |
model-index:
|
21 |
- name: electra-italian-xxl-cased-squad-it
|
22 |
results:
|
23 |
-
- task:
|
24 |
type: question-answering
|
25 |
-
name:
|
26 |
dataset:
|
27 |
type: squad_it
|
28 |
-
name:
|
29 |
metrics:
|
30 |
-
|
31 |
-
|
32 |
-
|
33 |
-
|
34 |
-
|
35 |
-
|
36 |
train-eval-index:
|
37 |
- config: default
|
38 |
task: question-answering
|
@@ -44,4 +94,40 @@ train-eval-index:
|
|
44 |
question: question
|
45 |
answers.text: answers.text
|
46 |
answers.answer_start: answers.answer_start
|
47 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
---
|
2 |
datasets:
|
3 |
- squad_it
|
4 |
+
metrics:
|
5 |
+
- squad
|
6 |
language:
|
7 |
- it
|
8 |
license: apache-2.0
|
9 |
tags:
|
10 |
+
- italian
|
11 |
+
- squad_it
|
12 |
+
- question-answering
|
13 |
widget:
|
14 |
+
- text: >-
|
15 |
+
La foresta pluviale amazzonica è diventata per lo più una foresta interna
|
16 |
+
intorno a quale evento globale?
|
17 |
+
context: >-
|
18 |
+
In seguito all' evento di estinzione del Cretaceo-Paleogene, l' estinzione
|
19 |
+
dei dinosauri e il clima umido possono aver permesso alla foresta pluviale
|
20 |
+
tropicale di diffondersi in tutto il continente. Dal 66-34 Mya, la foresta
|
21 |
+
pluviale si estendeva fino a sud fino a 45°. Le fluttuazioni climatiche
|
22 |
+
degli ultimi 34 milioni di anni hanno permesso alle regioni della savana di
|
23 |
+
espandersi fino ai tropici. Durante l' Oligocene, ad esempio, la foresta
|
24 |
+
pluviale ha attraversato una banda relativamente stretta. Si espandeva di
|
25 |
+
nuovo durante il Miocene medio, poi si ritrasse ad una formazione
|
26 |
+
prevalentemente interna all' ultimo massimo glaciale. Tuttavia, la foresta
|
27 |
+
pluviale è riuscita ancora a prosperare durante questi periodi glaciali,
|
28 |
+
consentendo la sopravvivenza e l' evoluzione di un' ampia varietà di specie.
|
29 |
+
- text: >-
|
30 |
+
Il Regno Unito e la Francia non hanno avuto interruzioni dell'
|
31 |
+
approvvigionamento petrolifero in quanto non hanno consentito a quale paese
|
32 |
+
di utilizzare il loro aeroporto?
|
33 |
+
context: >-
|
34 |
+
L' embargo non era uniforme in tutta Europa. Dei nove membri della Comunità
|
35 |
+
Economica Europea (CEE), i Paesi Bassi hanno dovuto affrontare un embargo
|
36 |
+
totale, il Regno Unito e la Francia hanno ricevuto forniture quasi
|
37 |
+
ininterrotte (poichè si sono rifiutati di consentire all' America di
|
38 |
+
utilizzare i loro aerodromi e le armi e forniture embargo sia agli arabi che
|
39 |
+
agli israeliani), mentre gli altri sei hanno dovuto affrontare tagli
|
40 |
+
parziali. Il Regno Unito era tradizionalmente un alleato di Israele, e il
|
41 |
+
governo di Harold Wilson ha sostenuto gli israeliani durante la guerra dei
|
42 |
+
sei giorni. Il suo successore, Ted Heath, ribaltò questa politica nel 1970,
|
43 |
+
chiedendo a Israele di ritirarsi ai suoi confini prima del 1967.
|
44 |
+
- context: >-
|
45 |
+
Nel 1962, il grafico Paul Rand ridisegna il logo ABC nella sua forma più
|
46 |
+
conosciuta (e attuale) con le lettere minuscole 'abc' racchiuse in un unico
|
47 |
+
cerchio nero. Il nuovo logo esordisce in onda per le promozioni di ABC all'
|
48 |
+
inizio della stagione 1963-64. Le lettere ricordano fortemente il carattere
|
49 |
+
tipografico Bauhaus disegnato da Herbert Bayer negli anni Venti, ma
|
50 |
+
condividono anche similitudini con diversi altri caratteri, come ITC Avant
|
51 |
+
Garde e Horatio, e lo Chalet più simile. La semplicità del logo ha reso più
|
52 |
+
facile la riprogettazione e la duplicazione, il che ha conferito un
|
53 |
+
beneficio per ABC (soprattutto prima dell' avvento della computer grafica).
|
54 |
+
text: Di quale carattere tipografico ricordano le lettere dell' iconico logo ABC?
|
55 |
+
- context: >-
|
56 |
+
La fotorespirazione può verificarsi quando la concentrazione di ossigeno è
|
57 |
+
troppo elevata. Rubisco non è in grado di distinguere molto bene tra
|
58 |
+
ossigeno e anidride carbonica, quindi può accidentalmente aggiungere O2
|
59 |
+
invece di CO2 a RuBP. Questo processo riduce l' efficienza della
|
60 |
+
fotosintesi: consuma ATP e ossigeno, rilascia CO2 e non produce zucchero.
|
61 |
+
Può sprecare fino alla metà del carbonio fissato dal ciclo di Calvin.
|
62 |
+
Diversi meccanismi si sono evoluti in diversi lignaggi che aumentano la
|
63 |
+
concentrazione di anidride carbonica rispetto all' ossigeno all' interno del
|
64 |
+
cloroplasto, aumentando l' efficienza della fotosintesi. Questi meccanismi
|
65 |
+
sono chiamati meccanismi di concentrazione dell' anidride carbonica, o CCM.
|
66 |
+
Tra questi figurano il metabolismo degli acidi crassulaceanici, la
|
67 |
+
fissazione del carbonio C4 e i pirenoidi. I cloroplasti negli impianti C4
|
68 |
+
sono notevoli in quanto presentano un chiaro dimorfismo cloroplastico.
|
69 |
+
text: Che cosa può fare rubisco per errore?
|
70 |
model-index:
|
71 |
- name: electra-italian-xxl-cased-squad-it
|
72 |
results:
|
73 |
+
- task:
|
74 |
type: question-answering
|
75 |
+
name: Question Answering
|
76 |
dataset:
|
77 |
type: squad_it
|
78 |
+
name: SQuAD-IT
|
79 |
metrics:
|
80 |
+
- type: f1
|
81 |
+
value: 0.775
|
82 |
+
name: Test F1
|
83 |
+
- type: exact-match
|
84 |
+
value: 0.660
|
85 |
+
name: Test Exact Match
|
86 |
train-eval-index:
|
87 |
- config: default
|
88 |
task: question-answering
|
|
|
94 |
question: question
|
95 |
answers.text: answers.text
|
96 |
answers.answer_start: answers.answer_start
|
97 |
+
|
98 |
+
---
|
99 |
+
|
100 |
+
# electra-italian-xxl-cased-squad-it
|
101 |
+
|
102 |
+
Electra model for (Extractive) Question Answering on Italian texts
|
103 |
+
|
104 |
+
## Model description
|
105 |
+
This model has been fine-tuned on [squad_it dataset](https://huggingface.co/datasets/squad_it), starting from the pre-trained model [dbmdz/electra-base-italian-xxl-cased-discriminator](https://huggingface.co/dbmdz/electra-base-italian-xxl-cased-discriminator).
|
106 |
+
|
107 |
+
It can be used for [Extractive Q&A](https://huggingface.co/tasks/question-answering) on Italian texts.
|
108 |
+
|
109 |
+
## Evaluation
|
110 |
+
|
111 |
+
| Metric | Value |
|
112 |
+
| ------ | --------- |
|
113 |
+
| **EM** | **0.660** |
|
114 |
+
| **F1** | **0.775** |
|
115 |
+
|
116 |
+
TO DO: link evaluation notebook
|
117 |
+
|
118 |
+
## Usage in Transformers
|
119 |
+
Model checkpoints are available for usage in Pytorch. They can be used directly with pipelines as:
|
120 |
+
|
121 |
+
```python
|
122 |
+
from transformers import pipelines
|
123 |
+
|
124 |
+
qa = pipeline('question-answering', model='anakin87/electra-italian-xxl-cased-squad-it')
|
125 |
+
qa(context="Vasco Rossi, noto anche semplicemente come Vasco e in passato con l'appellativo Blasco (Zocca, 7 febbraio 1952), è un cantautore italiano", question="Qual è il soprannome di Vasco Rossi?")
|
126 |
+
>>> {'score': 0.93, 'start': 80, 'end': 86, 'answer': 'Blasco'}
|
127 |
+
```
|
128 |
+
## Usage in Haystack
|
129 |
+
|
130 |
+
TO DO: link notebook
|
131 |
+
|
132 |
+
## Training procedure
|
133 |
+
TO DO: link training notebook
|