d0r1h commited on
Commit
e6d0f4c
1 Parent(s): 6a854d8

add app v.0.1

Browse files
Example/File.txt ADDED
@@ -0,0 +1 @@
 
 
1
+ पूर्वी नेपाल में अपशिष्ट जल प्रबंधन के लिए भारत 4 करोड़ रुपये से ज्यादा की मदद देगा। भारतीय दूतावास ने नेपाल सरकार के संघीय मामले और सामान्य प्रशासन विभाग और खुंबु पासंग ल्हामू ग्रामीण नगर पालिका, सोलुखुंबु के साथ खुमजुंग खुंडे अपशिष्ट जल प्रबंधन परियोजना के निर्माण के समझौते पर हस्ताक्षर किए हैं। भारत इसमें 4.10 करोड़ से ज्यादा की वित्तीय मदद देगा।भारतीय दूतावास ने बताया कि इस परियोजना से सोलुखुंबु के खुमजुंग गांव में रहने वाले लोगों को सुरक्षित पानी मिल सकेगा और स्वच्छता में सुधार होगा, जो सार्वजनिक स्वास्थ्य में सुधार के लिए जरूरी हैं।निकट पड़ोसी भारत और नेपाल के बीच व्यापक और बहुक्षेत्रीय सहयोग है। यह परियोजना लागू होने से अपने लोगों के जीवन स्तर को उठाने के लिए नेपाल सरकार के प्रयासों में भारतीय सहयोग परिलक्षित होगा।
README.md CHANGED
@@ -1,6 +1,6 @@
1
  ---
2
  title: Hindi_News_Summarizer
3
- emoji: 🦀
4
  colorFrom: indigo
5
  colorTo: yellow
6
  sdk: gradio
 
1
  ---
2
  title: Hindi_News_Summarizer
3
+ emoji: 📰
4
  colorFrom: indigo
5
  colorTo: yellow
6
  sdk: gradio
__pycache__/summarizer.cpython-38.pyc ADDED
Binary file (1.09 kB). View file
 
app.py ADDED
@@ -0,0 +1,23 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ import gradio as gr
2
+ from summarizer import summarize
3
+
4
+
5
+ with open("Example/File.txt", 'r', encoding="utf8") as f:
6
+ text = f.read()
7
+
8
+ sample = [text]
9
+
10
+ interface = gr.Interface(fn = summarize,
11
+ inputs = [gr.inputs.Textbox(lines=5,
12
+ placeholder="Enter your text...",
13
+ label='News Input'),
14
+ gr.inputs.Radio(["T5", "BART"], type="value", label='Model')
15
+ ],
16
+
17
+ outputs = [gr.outputs.Textbox(
18
+ label="Sar")],
19
+
20
+ title = "Hindi News Summarizer",
21
+ examples=[sample])
22
+
23
+ interface.launch(debug=True)
requirements.txt ADDED
@@ -0,0 +1,2 @@
 
 
 
1
+ torch
2
+ transformers
summarizer.py ADDED
@@ -0,0 +1,38 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ import re
2
+ from transformers import AutoModelForSeq2SeqLM, AutoTokenizer
3
+
4
+ def summarize(text, model):
5
+
6
+ if model == "T5":
7
+ checkpoint = "csebuetnlp/mT5_multilingual_XLSum"
8
+ elif model == "BART":
9
+ checkpoint = "ai4bharat/IndicBART"
10
+
11
+ WHITESPACE_HANDLER = lambda k: re.sub('\s+', ' ', re.sub('\n+', ' ', k.strip()))
12
+
13
+
14
+ tokenizer = AutoTokenizer.from_pretrained(checkpoint)
15
+ model = AutoModelForSeq2SeqLM.from_pretrained(checkpoint)
16
+
17
+
18
+ input_ids = tokenizer(
19
+ [WHITESPACE_HANDLER(text)],
20
+ return_tensors="pt",
21
+ padding="max_length",
22
+ truncation=True,
23
+ max_length=512 )["input_ids"]
24
+
25
+ output_ids = model.generate(
26
+ input_ids=input_ids,
27
+ max_length=70,
28
+ min_length=30,
29
+ no_repeat_ngram_size=2,
30
+ num_beams=4 )[0]
31
+
32
+
33
+ summary = tokenizer.decode(
34
+ output_ids,
35
+ skip_special_tokens=True,
36
+ clean_up_tokenization_spaces=False )
37
+
38
+ return summary