File size: 3,804 Bytes
1023694
9b86c9a
1023694
 
9b86c9a
 
 
 
 
 
 
 
 
 
 
 
 
1023694
 
 
 
b4fb709
6741362
 
b4fb709
 
 
6741362
b4fb709
 
 
6741362
 
 
 
 
 
 
b4fb709
6741362
b4fb709
 
 
6741362
b4fb709
 
 
 
 
 
6741362
 
b4fb709
6741362
 
 
b4fb709
 
6741362
 
b4fb709
 
 
6741362
b4fb709
6741362
b4fb709
 
 
 
85307d8
b4fb709
85307d8
 
6741362
b4fb709
 
85307d8
b4fb709
 
6741362
b4fb709
 
 
 
 
 
6741362
 
 
 
 
b4fb709
6741362
b4fb709
 
6741362
b4fb709
6741362
 
b4fb709
 
 
 
 
f8fe556
b4fb709
 
 
6741362
b4fb709
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
---
language:
  - tr
tags:
  - question-answering
  - text-generation
pipeline-tag:
  - text-generation
metrics:
  - RougeL
  - BLEU-4
  - F1
  - EM
widget:
  - text: question:Antik Yunan felsefesi, MÖ. 6. yüzyılda başlamış ve Hellenistik çağ ile Roma İmparatorluğu arasında devam etmiştir.   Felsefe kelimesi Yunanlar tarafından kullanılmaya başlandı. Önceleri bilimi, matematiği, siyaseti ve etiği de kapsayan bir terimdi.  Felsefe terimi neleri kapsar?
    example_title: Turkish Generative QA
licence: bigscience-openrail-m
---



# Turkish Question Answering model based on mt0-large
In this model, I fine-tuned *mT0-large* model with the following Turkish QA datasets where the training set size is around 11K QAs.

* https://huggingface.co/bigscience/mt0-large
* https://github.com/okanvk/Turkish-Reading-Comprehension-Question-Answering-Dataset

The model is tuned within one of parameter-efficient fine-tuning techniques, which is PEFT LORA. So we need to install peft modules. Please check
* https://github.com/huggingface/peft


# FOR INFERENCE

We first install the requirements : 
```
!pip install peft transformers  # in jupyter notebook

```

## SINGLE INFERENCE

```
from peft import PeftModel, PeftConfig
from transformers import AutoModelForSeq2SeqLM, AutoTokenizer 
peft_model_path="savasy/mt0-large-Turkish-qa"

config = PeftConfig.from_pretrained(peft_model_path)
model = AutoModelForSeq2SeqLM.from_pretrained(
    config.base_model_name_or_path)

#tokenizer
tokenizer = AutoTokenizer.from_pretrained(config.base_model_name_or_path)

# Wrap the model with the LORA
inference_model = PeftModel.from_pretrained(model, peft_model_path)
inference_model.eval()

inference_model.to("cuda")
test_input = '''
  Mustafa adını babası Ali Rıza Efendi kendi dedesinin adı olduğundan dolayı vermiştir. Çünkü Ali Rıza Efendi'nin babasının adı olan
 Ahmed adı ağabeylerinden birisine verilmişti. Mustafa'ya neden Kemal isminin verildiğine yönelik ise çeşitli iddialar vardır. 
 Afet İnan, bu ismi ona matematik öğretmeni Üsküplü Mustafa Efendi'nin Kemal adının anlamında olduğu gibi onun "mükemmel ve olgun" 
 olduğunu göstermek için verdiğini söylemiştir. (source: wikipedia) .  
 Mustafa'nın dedesinin ismi nedir ?
 '''
import torch
with torch.no_grad():
  inputs = tokenizer(test_input, return_tensors="pt", padding=True).to("cuda")
  generated_ids = inference_model.generate(**inputs)
  outputs = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)
outputs
-> [Ahmed]
```

## BATCH INFERENCE

The usage for batch mode is as follows:

```
from peft import PeftModel, PeftConfig
from transformers import AutoModelForSeq2SeqLM, AutoTokenizer 
peft_model_path="savasy/mt0-large-Turkish-qa"

config = PeftConfig.from_pretrained(peft_model_path)
model = AutoModelForSeq2SeqLM.from_pretrained(
    config.base_model_name_or_path)

#tokenizer
tokenizer = AutoTokenizer.from_pretrained(config.base_model_name_or_path)

# Wrap the model with the LORA
inference_model = PeftModel.from_pretrained(model, peft_model_path)
inference_model.eval()

inference_model.to("cuda")

test_inputs = ["","","",""] #  a list of texts. A text must have Content followed by a Question

preds=[] # for predictions
data_loader= DataLoader(test_inputs,batch_size=8)
from tqdm import tqdm

with torch.no_grad():
  for batch in tqdm(data_loader):
    inputs = tokenizer(batch, return_tensors="pt", padding=True).to("cuda")
    generated_ids = inference_model.generate(**inputs)
    outputs = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)
    preds+=outputs
```
In the end, you can compare *preds*  (predictions) with your expected ground-truth results. You can use many metrics for this such as BLEU, ROUGE, Exact Match, Partial Match