ozcangundes commited on
Commit
194194e
1 Parent(s): 96ad48f

Create README.md

Browse files
Files changed (1) hide show
  1. README.md +76 -0
README.md ADDED
@@ -0,0 +1,76 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ language: turkish
3
+ datasets:
4
+ - TQUAD
5
+ pipeline_tag: question-answering
6
+ license: MIT
7
+ ---
8
+
9
+ # mT5-small based Turkish Question Answering System
10
+
11
+ [Google's Multilingual T5-small](https://github.com/google-research/multilingual-t5) is fine-tuned on [Turkish Question Answering dataset](https://github.com/TQuad/turkish-nlp-qa-dataset) for **Q&A** downstream task by using Pytorch Lightning.⚡
12
+
13
+ The notebook that includes all fine tuning process will be shared on my Github page later.
14
+
15
+ **Important Note**: mT5 was only pre-trained on [mC4](https://www.tensorflow.org/datasets/catalog/c4#c4multilingual)
16
+ excluding any supervised training. Therefore, the mT5 model has to be fine-tuned before it is useable on a downstream task.
17
+
18
+ ## Usage 🚀
19
+
20
+ ```python
21
+ import torch
22
+ from transformers import MT5ForConditionalGeneration, MT5Tokenizer
23
+
24
+ tokenizer = T5Tokenizer.from_pretrained("ozcangundes/mt5-small-turkish-squad")
25
+ model = T5ForConditionalGeneration.from_pretrained("ozcangundes/mt5-small-turkish-squad")
26
+
27
+ def get_answer(question,context):
28
+ source_encoding=tokenizer(
29
+ question,
30
+ context,
31
+ max_length=512,
32
+ padding="max_length",
33
+ truncation="only_second",
34
+ return_attention_mask=True,
35
+ add_special_tokens=True,
36
+ return_tensors="pt")
37
+
38
+ generated_ids=model.generate(
39
+ input_ids=source_encoding["input_ids"],
40
+ attention_mask=source_encoding["attention_mask"])
41
+
42
+ preds=[tokenizer.decode(gen_id, skip_special_tokens=True, clean_up_tokenization_spaces=True) for gen_id in generated_ids]
43
+
44
+ return "".join(preds)
45
+ ```
46
+
47
+ ### Example 1
48
+ ```python
49
+ question={
50
+ "context":"Pardus, Google'ın öğrencilerle staj ve kendini geliştirme imkânı ile tasarılara geliştirici ve katkı sağlamayı amaçladığı açık kaynak tasarısı Google Summer of Code'a 2008 ve 2009 olmak üzere iki kere katılmıştır. Bu organizasyona ilk katılan Türk tasarısı Pardus olmuştur. Bazı dönemlerde Pardus hakkındaki gelişmeleri halka duyurmak ve tasarıya olan ilgiyi arttırmak amacıyla CeBIT Eurasia Bilişim Fuarı'na katılım sağlanmaktadır. 2006, 2008, 2009, 2010, 2011,2013 ve 2014 bu fuarlarda Pardus standı kurulmuştur.2014 yılında ICT SummitT Now Bilişim Zirvesi'nde yer alınmıştır. BİLİŞİM’2014 TBD 31. Ulusal Bilişim Kurultayı ve CITEX’2014 Ankara Bilişim Fuarı’na Gümüş sponsorluk ile katkıda bulunulmuş ve Pardus standı kurulmuştur.",
51
+ "question":"Pardus’un Google Summer of Code'a katıldığı yıllar nelerdir?"
52
+ }
53
+
54
+ generate_answer(question["question"],question["context"])
55
+ ```
56
+ > 2008 ve 2009
57
+
58
+ ### Example 2
59
+ ```python
60
+ question2={
61
+ "context":"II. Bayezid ve I. Selim devrinde yaşadı ve iki defa hekimbaşılık yaptı. Böbrek ve idrar kesesindeki taş oluşumunun nedenlerini ve tedavisini incelediği eseriyle tanınır. Adı kaynaklarda Ahmed ve Mahmud olarak da geçer. Ahi Çelebi olarak ün yapmıştır. Babası Tabib Mevlana Kemal ile birlikte 1463’te İstanbul’a yerleşti. Mevlana Kemal, devrin ünlü hekimlerindendir. Tebriz ya da Şirvan asıllı olduğu çeşitli kaynaklarda belirtilir. Ahi Mehmet Çelebi, hekimliği daha çok babasından öğrendi. Onun ölümünden sonra devrin önemli hekimleri Kutbüddin ile Altunîzâde’den ders alıp kısa zamanda mesleğini ilerletti. Hekimlik becerisinin yanı sıra kuramsal bilgisiyle de kendisini kabul ettirerek önce Fâtih Darüşşifasına hekim, sonra da başhekim oldu. II. Bayezid’in güvenini kazanarak mutfak eminliğine, ardından da Hekimbaşılığa getirildi. Dört buçuk yıl bu görevde kalan Ahî Çelebi, II. Bayezid’in ölümü üzerine geleneğe uyularak azledildi. Bir müddet sonra Yavuz onu tekrar Hekimbaşılığa getirdi ve Mısır seferine beraberinde götürdü. I. Selim'in ölümünden sonra Hekimbaşılık tan tekrar azledildi. Kaynakların belirttiğine göre, yaşı doksanı geçmiş olduğu halde, hacdan dönerken Kahire’de ölmüş ve İmam Şafi'nin kabri civarına defnedilmiştir.",
62
+ "question":"Ahi Mehmet Çelebi hangi eseri ile tanınır?"
63
+ }
64
+
65
+ generate_answer(question2["question"],question2["context"])
66
+ ```
67
+ > Böbrek ve idrar kesesindeki taş oluşumunun nedenlerini ve tedavisini incelediği eseriyle
68
+
69
+ Created by Özcan Gündeş ✌️
70
+ ---
71
+
72
+ Twitter: <a href="https://twitter.com/ozcangundes" target="blank"><img align="center" src="https://cdn.jsdelivr.net/npm/simple-icons@3.0.1/icons/twitter.svg" alt="ozcangundes" height="30" width="30" /></a>
73
+ Linkedin: <a href="https://www.linkedin.com/in/%C3%B6zcan-g%C3%BCnde%C5%9F-7693055b/" target="blank"><img align="center" src="https://cdn.jsdelivr.net/npm/simple-icons@3.0.1/icons/linkedin.svg" alt="13198517" height="30" width="30" /></a>
74
+ Medium: <a href="https://medium.com/@ozcangundes" target="blank"><img align="center" src="https://cdn.jsdelivr.net/npm/simple-icons@3.0.1/icons/medium.svg" alt="@ozcangundes" height="30" width="30" /></a>
75
+ Github: <a href="https://github.com/@ozcangundes" target="blank"><img align="center" src="https://cdn.jsdelivr.net/npm/simple-icons@3.0.1/icons/github.svg" alt="@ozcangundes" height="30" width="30" /></a>
76
+