Spaces:

somosnlp-hackathon-2023
/

learning-assistance

Runtime error

App Files Files Community

Alberto Carmona commited on Mar 29, 2023

Commit

5537833

•

1 Parent(s): 92bb964

Add the summarize function

Browse files

Files changed (3) hide show

app.py +3 -2
functions.py +42 -0
requirements.txt +9 -1

app.py CHANGED Viewed

@@ -1,5 +1,6 @@
 import gradio as gr
-from functions import extract_text
 def update(name='default text'):
@@ -25,7 +26,7 @@ with gr.Blocks() as demo:
     gr.Markdown("Puede obtener un resumen del texto extraído.")
     btn_summarize = gr.Button("Elaborar resumen")
     out_summary = gr.Textbox(label="Resumen")
-    btn_summarize.click(fn=update, inputs=out_url_text, outputs=out_summary)
     # Question generation section
     gr.Markdown("## Evalúa tu conocimiento")

 import gradio as gr
+from functions import extract_text, summarize_text
 def update(name='default text'):
     gr.Markdown("Puede obtener un resumen del texto extraído.")
     btn_summarize = gr.Button("Elaborar resumen")
     out_summary = gr.Textbox(label="Resumen")
+    btn_summarize.click(fn=summarize_text, inputs=out_url_text, outputs=out_summary)
     # Question generation section
     gr.Markdown("## Evalúa tu conocimiento")

functions.py CHANGED Viewed

@@ -1,11 +1,53 @@
 import requests
 from bs4 import BeautifulSoup
 def extract_text(url: str):
     if url is None or url.strip() == '':
         return ''
     response = requests.get(url)
     soup = BeautifulSoup(response.text, "html.parser")
     text = '\n\n'.join(map(lambda p: p.text, soup.find_all('p')))
     return text

 import requests
 from bs4 import BeautifulSoup
+import torch
+from peft import PeftModel, PeftConfig
+from transformers import AutoModelForCausalLM, AutoTokenizer, GenerationConfig
+generation_config = GenerationConfig(temperature=.8,
+                                     top_p=0.75,
+                                     top_k=40)
 def extract_text(url: str):
+    print(['extract_text', 'start'])
     if url is None or url.strip() == '':
         return ''
     response = requests.get(url)
     soup = BeautifulSoup(response.text, "html.parser")
     text = '\n\n'.join(map(lambda p: p.text, soup.find_all('p')))
+    print(['extract_text', 'end'])
     return text
+def summarize_text(text: str):
+    print(['summarize_text', 'start'])
+    input_text = f'<s>Instruction: Elabora un resume del siguiente texto.\nInput: {text}\nOutput: '
+    batch = tokenizer(input_text, return_tensors='pt')
+    print(['summarize_text', 'generating'])
+    with torch.cuda.amp.autocast():
+        output_tokens = model.generate(**batch,
+                                    max_new_tokens=256,
+                                    generation_config=generation_config
+                                    )
+    output = tokenizer.decode(output_tokens[0], skip_special_tokens=True)
+    print(['summarize_text', 'end'])
+    return output
+def load_model(peft_model_id):
+    print(['load_model', 'start'])
+    config = PeftConfig.from_pretrained(peft_model_id)
+    print(['load_model', 'loading model'])
+    model = AutoModelForCausalLM.from_pretrained(
+        config.base_model_name_or_path, return_dict=True, load_in_8bit=True, device_map='auto')
+    print(['load_model', 'loading tokenizer'])
+    tokenizer = AutoTokenizer.from_pretrained(config.base_model_name_or_path)
+    model = PeftModel.from_pretrained(model, peft_model_id)
+    model.config.use_cache = True
+    print(['load_model', 'end'])
+    return model, tokenizer
+model, tokenizer = load_model("milyiyo/opt-6.7b-lora-sag-t3000-v300-v2")

requirements.txt CHANGED Viewed

@@ -1,2 +1,10 @@
-requests
 beautifulsoup4

+accelerate
 beautifulsoup4
+bitsandbytes
+datasets
+loralib
+peft
+requests
+sentencepiece
+torch
+transformers