Spaces:

d0r1h
/

Hindi_News_Summarizer

Runtime error

App Files Files Community

d0r1h commited on Apr 6, 2022

Commit

e6d0f4c

•

1 Parent(s): 6a854d8

add app v.0.1

Browse files

Files changed (6) hide show

Example/File.txt +1 -0
README.md +1 -1
__pycache__/summarizer.cpython-38.pyc +0 -0
app.py +23 -0
requirements.txt +2 -0
summarizer.py +38 -0

Example/File.txt ADDED Viewed

	@@ -0,0 +1 @@

+ पूर्वी नेपाल में अपशिष्ट जल प्रबंधन के लिए भारत 4 करोड़ रुपये से ज्यादा की मदद देगा। भारतीय दूतावास ने नेपाल सरकार के संघीय मामले और सामान्य प्रशासन विभाग और खुंबु पासंग ल्हामू ग्रामीण नगर पालिका, सोलुखुंबु के साथ खुमजुंग खुंडे अपशिष्ट जल प्रबंधन परियोजना के निर्माण के समझौते पर हस्ताक्षर किए हैं। भारत इसमें 4.10 करोड़ से ज्यादा की वित्तीय मदद देगा।भारतीय दूतावास ने बताया कि इस परियोजना से सोलुखुंबु के खुमजुंग गांव में रहने वाले लोगों को सुरक्षित पानी मिल सकेगा और स्वच्छता में सुधार होगा, जो सार्वजनिक स्वास्थ्य में सुधार के लिए जरूरी हैं।निकट पड़ोसी भारत और नेपाल के बीच व्यापक और बहुक्षेत्रीय सहयोग है। यह परियोजना लागू होने से अपने लोगों के जीवन स्तर को उठाने के लिए नेपाल सरकार के प्रयासों में भारतीय सहयोग परिलक्षित होगा।

README.md CHANGED Viewed

@@ -1,6 +1,6 @@
 ---
 title: Hindi_News_Summarizer
-emoji: 🦀
 colorFrom: indigo
 colorTo: yellow
 sdk: gradio

 ---
 title: Hindi_News_Summarizer
+emoji: 📰
 colorFrom: indigo
 colorTo: yellow
 sdk: gradio

__pycache__/summarizer.cpython-38.pyc ADDED Viewed

Binary file (1.09 kB). View file

app.py ADDED Viewed

	@@ -0,0 +1,23 @@

+import gradio as gr
+from summarizer import summarize
+with open("Example/File.txt", 'r',  encoding="utf8") as f:
+    text = f.read()
+sample = [text]
+interface = gr.Interface(fn = summarize,
+                        inputs = [gr.inputs.Textbox(lines=5,
+                                                    placeholder="Enter your text...",
+                                                    label='News Input'),
+                                  gr.inputs.Radio(["T5", "BART"], type="value", label='Model')
+                                  ],
+                        outputs = [gr.outputs.Textbox(
+                                                      label="Sar")],
+                        title = "Hindi News Summarizer",
+                        examples=[sample])
+interface.launch(debug=True)

requirements.txt ADDED Viewed

	@@ -0,0 +1,2 @@


1	+ torch
2	+ transformers

summarizer.py ADDED Viewed

	@@ -0,0 +1,38 @@

+import re
+from transformers import  AutoModelForSeq2SeqLM, AutoTokenizer
+def summarize(text, model):
+  if model == "T5":
+    checkpoint = "csebuetnlp/mT5_multilingual_XLSum"
+  elif model == "BART":
+    checkpoint = "ai4bharat/IndicBART"
+  WHITESPACE_HANDLER = lambda k: re.sub('\s+', ' ', re.sub('\n+', ' ', k.strip()))
+  tokenizer = AutoTokenizer.from_pretrained(checkpoint)
+  model = AutoModelForSeq2SeqLM.from_pretrained(checkpoint)
+  input_ids = tokenizer(
+                  [WHITESPACE_HANDLER(text)],
+                  return_tensors="pt",
+                  padding="max_length",
+                  truncation=True,
+                  max_length=512 )["input_ids"]
+  output_ids = model.generate(
+                    input_ids=input_ids,
+                    max_length=70,
+                    min_length=30,
+                    no_repeat_ngram_size=2,
+                    num_beams=4 )[0]
+  summary = tokenizer.decode(
+                      output_ids,
+                      skip_special_tokens=True,
+                      clean_up_tokenization_spaces=False )
+  return summary