Spaces:
Runtime error
Runtime error
add app v.0.1
Browse files- Example/File.txt +1 -0
- README.md +1 -1
- __pycache__/summarizer.cpython-38.pyc +0 -0
- app.py +23 -0
- requirements.txt +2 -0
- summarizer.py +38 -0
Example/File.txt
ADDED
@@ -0,0 +1 @@
|
|
|
|
|
1 |
+
पूर्वी नेपाल में अपशिष्ट जल प्रबंधन के लिए भारत 4 करोड़ रुपये से ज्यादा की मदद देगा। भारतीय दूतावास ने नेपाल सरकार के संघीय मामले और सामान्य प्रशासन विभाग और खुंबु पासंग ल्हामू ग्रामीण नगर पालिका, सोलुखुंबु के साथ खुमजुंग खुंडे अपशिष्ट जल प्रबंधन परियोजना के निर्माण के समझौते पर हस्ताक्षर किए हैं। भारत इसमें 4.10 करोड़ से ज्यादा की वित्तीय मदद देगा।भारतीय दूतावास ने बताया कि इस परियोजना से सोलुखुंबु के खुमजुंग गांव में रहने वाले लोगों को सुरक्षित पानी मिल सकेगा और स्वच्छता में सुधार होगा, जो सार्वजनिक स्वास्थ्य में सुधार के लिए जरूरी हैं।निकट पड़ोसी भारत और नेपाल के बीच व्यापक और बहुक्षेत्रीय सहयोग है। यह परियोजना लागू होने से अपने लोगों के जीवन स्तर को उठाने के लिए नेपाल सरकार के प्रयासों में भारतीय सहयोग परिलक्षित होगा।
|
README.md
CHANGED
@@ -1,6 +1,6 @@
|
|
1 |
---
|
2 |
title: Hindi_News_Summarizer
|
3 |
-
emoji:
|
4 |
colorFrom: indigo
|
5 |
colorTo: yellow
|
6 |
sdk: gradio
|
|
|
1 |
---
|
2 |
title: Hindi_News_Summarizer
|
3 |
+
emoji: 📰
|
4 |
colorFrom: indigo
|
5 |
colorTo: yellow
|
6 |
sdk: gradio
|
__pycache__/summarizer.cpython-38.pyc
ADDED
Binary file (1.09 kB). View file
|
|
app.py
ADDED
@@ -0,0 +1,23 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
import gradio as gr
|
2 |
+
from summarizer import summarize
|
3 |
+
|
4 |
+
|
5 |
+
with open("Example/File.txt", 'r', encoding="utf8") as f:
|
6 |
+
text = f.read()
|
7 |
+
|
8 |
+
sample = [text]
|
9 |
+
|
10 |
+
interface = gr.Interface(fn = summarize,
|
11 |
+
inputs = [gr.inputs.Textbox(lines=5,
|
12 |
+
placeholder="Enter your text...",
|
13 |
+
label='News Input'),
|
14 |
+
gr.inputs.Radio(["T5", "BART"], type="value", label='Model')
|
15 |
+
],
|
16 |
+
|
17 |
+
outputs = [gr.outputs.Textbox(
|
18 |
+
label="Sar")],
|
19 |
+
|
20 |
+
title = "Hindi News Summarizer",
|
21 |
+
examples=[sample])
|
22 |
+
|
23 |
+
interface.launch(debug=True)
|
requirements.txt
ADDED
@@ -0,0 +1,2 @@
|
|
|
|
|
|
|
1 |
+
torch
|
2 |
+
transformers
|
summarizer.py
ADDED
@@ -0,0 +1,38 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
import re
|
2 |
+
from transformers import AutoModelForSeq2SeqLM, AutoTokenizer
|
3 |
+
|
4 |
+
def summarize(text, model):
|
5 |
+
|
6 |
+
if model == "T5":
|
7 |
+
checkpoint = "csebuetnlp/mT5_multilingual_XLSum"
|
8 |
+
elif model == "BART":
|
9 |
+
checkpoint = "ai4bharat/IndicBART"
|
10 |
+
|
11 |
+
WHITESPACE_HANDLER = lambda k: re.sub('\s+', ' ', re.sub('\n+', ' ', k.strip()))
|
12 |
+
|
13 |
+
|
14 |
+
tokenizer = AutoTokenizer.from_pretrained(checkpoint)
|
15 |
+
model = AutoModelForSeq2SeqLM.from_pretrained(checkpoint)
|
16 |
+
|
17 |
+
|
18 |
+
input_ids = tokenizer(
|
19 |
+
[WHITESPACE_HANDLER(text)],
|
20 |
+
return_tensors="pt",
|
21 |
+
padding="max_length",
|
22 |
+
truncation=True,
|
23 |
+
max_length=512 )["input_ids"]
|
24 |
+
|
25 |
+
output_ids = model.generate(
|
26 |
+
input_ids=input_ids,
|
27 |
+
max_length=70,
|
28 |
+
min_length=30,
|
29 |
+
no_repeat_ngram_size=2,
|
30 |
+
num_beams=4 )[0]
|
31 |
+
|
32 |
+
|
33 |
+
summary = tokenizer.decode(
|
34 |
+
output_ids,
|
35 |
+
skip_special_tokens=True,
|
36 |
+
clean_up_tokenization_spaces=False )
|
37 |
+
|
38 |
+
return summary
|