Spaces:
Runtime error
Runtime error
Update app.py
Browse files
app.py
CHANGED
@@ -2,91 +2,142 @@ import gradio as gr
|
|
2 |
from transformers import pipeline
|
3 |
import pandas as pd
|
4 |
import json
|
|
|
|
|
|
|
|
|
5 |
|
6 |
-
|
7 |
|
8 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
9 |
print(in_text)
|
10 |
-
|
|
|
11 |
print(answer)
|
12 |
return answer[0]["summary_text"]
|
|
|
13 |
|
14 |
-
def update_history(df, in_text, gen_text ,
|
15 |
# get rid of first seed phrase
|
16 |
new_row = [{"In_text": in_text,
|
17 |
"Gen_text": gen_text,
|
18 |
-
"
|
|
|
19 |
"Parameters": json.dumps(parameters)}]
|
20 |
return pd.concat([df, pd.DataFrame(new_row)])
|
21 |
|
22 |
-
def generate_transformer(in_text, num_beams ,history):
|
23 |
-
gen_text= generate(in_text)
|
24 |
-
return gen_text, update_history(history, in_text, gen_text, "
|
25 |
-
|
|
|
26 |
|
27 |
-
|
28 |
-
|
|
|
|
|
29 |
|
30 |
-
with gr.Accordion("See Details", open=False):
|
31 |
-
gr.Markdown("lorem ipsum")
|
32 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
33 |
|
34 |
with gr.Tabs():
|
35 |
-
with gr.TabItem("
|
36 |
gr.Markdown(
|
37 |
-
"""The default parameters for
|
38 |
-
|
39 |
-
|
40 |
with gr.Row():
|
41 |
with gr.Column(scale=4):
|
42 |
-
text_baseline_transformer= gr.
|
|
|
43 |
with gr.Column(scale=3):
|
44 |
with gr.Row():
|
45 |
-
num_beams = gr.Slider(minimum=2, maximum=10, value=2, step=1, label="Number of
|
|
|
|
|
|
|
46 |
output_basline_transformer = gr.Textbox(label="Output Text")
|
47 |
-
transformer_button = gr.Button("Summarize!")
|
48 |
-
|
49 |
-
# with gr.TabItem("Strong Baseline"):
|
50 |
-
# gr.Markdown(
|
51 |
-
# """The default parameters for distilgpt2 work well to generate moves. Use this tab as
|
52 |
-
# a baseline for your experiments.""")
|
53 |
-
# with gr.Row():
|
54 |
-
# with gr.Column(scale=4):
|
55 |
-
# text_baseline= gr.Textbox(lines=4,label="Input Text", placeholder="hej hej",)
|
56 |
-
# with gr.Column(scale=3):
|
57 |
-
# with gr.Row():
|
58 |
-
# num_beams2 = gr.Slider(minimum=2, maximum=10, value=2, step=1, label="Number of Beams2")
|
59 |
-
# num_beams3 = gr.Slider(minimum=2, maximum=10, value=2, step=1, label="Number of Beams3")
|
60 |
-
# output_basline = gr.Textbox(label="Output Text")
|
61 |
-
# baseline_button = gr.Button("Summarize!")
|
62 |
-
|
63 |
-
# with gr.TabItem("LexRank"):
|
64 |
-
# gr.Markdown(
|
65 |
-
# """The default parameters for distilgpt2 work well to generate moves. Use this tab as
|
66 |
-
# a baseline for your experiments.""")
|
67 |
-
# with gr.Row():
|
68 |
-
# label="Number of Beams")
|
69 |
-
# text_baseline= gr.Textbox(label="Input Text", placeholder="hej hej",)
|
70 |
-
# output_basline = gr.Textbox(label="Output Text")
|
71 |
-
# baseline_button = gr.Button("Summarize!")
|
72 |
-
|
73 |
-
gr.Examples([["hi", 5]], [text_baseline_transformer, num_beams])
|
74 |
-
|
75 |
-
with gr.Box():
|
76 |
-
gr.Markdown("<h3> Generation History <h3>")
|
77 |
-
# Displays a dataframe with the history of moves generated, with parameters
|
78 |
-
history = gr.Dataframe(headers=["In_text", "Gen_text", "Generation Type", "Parameters"], overflow_row_behaviour="show_ends", wrap=True)
|
79 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
80 |
|
81 |
|
82 |
-
|
83 |
-
|
84 |
-
|
85 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
86 |
|
|
|
|
|
|
|
|
|
|
|
|
|
87 |
|
|
|
|
|
|
|
|
|
88 |
|
89 |
-
|
|
|
90 |
|
91 |
|
92 |
demo.launch()
|
|
|
2 |
from transformers import pipeline
|
3 |
import pandas as pd
|
4 |
import json
|
5 |
+
import nltk
|
6 |
+
from sentence_transformers import SentenceTransformer, util
|
7 |
+
import numpy as np
|
8 |
+
import LexRank
|
9 |
|
10 |
+
nltk.download('punkt')
|
11 |
|
12 |
+
|
13 |
+
def lex_rank(in_text, threshold=None , model_in = 'KBLab/sentence-bert-swedish-cased', language='swedish' ):
|
14 |
+
if threshold == 'None':
|
15 |
+
threshold=None
|
16 |
+
|
17 |
+
model = SentenceTransformer(model_in)
|
18 |
+
#Split the document into sentences
|
19 |
+
sentences = nltk.sent_tokenize(document, language=language)
|
20 |
+
print("1")
|
21 |
+
#Compute the sentence embeddings
|
22 |
+
embeddings = model.encode(sentences, convert_to_tensor=True)
|
23 |
+
cos_scores = util.cos_sim(embeddings, embeddings).cpu().numpy()
|
24 |
+
print("2")
|
25 |
+
|
26 |
+
#Compute the centrality for each sentence
|
27 |
+
centrality_scores = degree_centrality_scores(cos_scores, threshold=threshold)
|
28 |
+
|
29 |
+
most_central_sentence_indices = np.argsort(-centrality_scores)
|
30 |
+
sent_list= []
|
31 |
+
for idx in most_central_sentence_indices[0:4]:
|
32 |
+
sent_list.append(sentences[idx])
|
33 |
+
return ' '.join(sent_list)
|
34 |
+
|
35 |
+
|
36 |
+
def generate(in_text, num_beams, min_len, max_len, model_in):
|
37 |
print(in_text)
|
38 |
+
pipe = pipeline("summarization", model=model_in)
|
39 |
+
answer = pipe(in_text, num_beams=num_beams ,min_length=min_len, max_length=max_len)
|
40 |
print(answer)
|
41 |
return answer[0]["summary_text"]
|
42 |
+
|
43 |
|
44 |
+
def update_history(df, in_text, gen_text ,model_in, sum_typ ,parameters):
|
45 |
# get rid of first seed phrase
|
46 |
new_row = [{"In_text": in_text,
|
47 |
"Gen_text": gen_text,
|
48 |
+
"Sum_type": sum_typ ,
|
49 |
+
"Gen_model": model_in,
|
50 |
"Parameters": json.dumps(parameters)}]
|
51 |
return pd.concat([df, pd.DataFrame(new_row)])
|
52 |
|
53 |
+
def generate_transformer(in_text, num_beams, min_len, max_len, model_in,history):
|
54 |
+
gen_text= generate(in_text,num_beams, min_len, max_len, model_in)
|
55 |
+
return gen_text, update_history(history, in_text, gen_text, "Abstractive" ,model_in, {"num_beams": num_beams,
|
56 |
+
"min_len": min_len,
|
57 |
+
"max_len": max_len})
|
58 |
|
59 |
+
def generate_lexrank(in_text, threshold, model_in, language, history):
|
60 |
+
gen_text= lex_rank(in_text, threshold, model_in, language)
|
61 |
+
return gen_text, update_history(history, in_text, gen_text, "Extractive" ,model_in, {"threshold": threshold,
|
62 |
+
"language": language})
|
63 |
|
|
|
|
|
64 |
|
65 |
+
with gr.Blocks() as demo:
|
66 |
+
gr.Markdown("""# Swedish Summarization Engine!""")
|
67 |
+
with gr.Accordion("Read here for details about the app", open=False):
|
68 |
+
with gr.Tabs():
|
69 |
+
with gr.TabItem("Summarization app"):
|
70 |
+
gr.Markdown("""
|
71 |
+
<h3>Blabla works like this.<h3>
|
72 |
+
<p>lorem ipsum bl
|
73 |
+
Blabla
|
74 |
+
bl <p>
|
75 |
+
""")
|
76 |
+
with gr.TabItem("Abstractive vs Extractive"):
|
77 |
+
gr.Markdown("""
|
78 |
+
<h3>Abstractive vs Extractive.<h3>
|
79 |
+
<p>blablaba<p>""")
|
80 |
+
with gr.TabItem("Training and Data"):
|
81 |
+
gr.Markdown("""
|
82 |
+
<h3>Abstractive vs Extractive.<h3>
|
83 |
+
<p>blablaba<p>""")
|
84 |
|
85 |
with gr.Tabs():
|
86 |
+
with gr.TabItem("Abstractive Generation for Summarization"):
|
87 |
gr.Markdown(
|
88 |
+
"""The default parameters for this transformer based model work well to generate summarization.
|
89 |
+
Use this tab to experiment summarization task of text for different types Abstractive models.""")
|
|
|
90 |
with gr.Row():
|
91 |
with gr.Column(scale=4):
|
92 |
+
text_baseline_transformer= gr.TextArea(label="Input text to summarize", placeholder="Input summarization",)
|
93 |
+
transformer_button = gr.Button("Summarize!")
|
94 |
with gr.Column(scale=3):
|
95 |
with gr.Row():
|
96 |
+
num_beams = gr.Slider(minimum=2, maximum=10, value=2, step=1, label="Number of Beams")
|
97 |
+
min_len = gr.Slider(minimum=10, maximum=50, value=25, step=5, label="Min length")
|
98 |
+
max_len = gr.Slider(minimum=50, maximum=130, value=120, step=10, label="Max length")
|
99 |
+
model_in = gr.Dropdown(["Gabriel/bart-base-cnn-swe", "Gabriel/bart-base-cnn-xsum-swe", "Gabriel/bart-base-cnn-xsum-wiki-swe"], value="Gabriel/bart-base-cnn-xsum-swe", label="Model")
|
100 |
output_basline_transformer = gr.Textbox(label="Output Text")
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
101 |
|
102 |
+
with gr.Row():
|
103 |
+
with gr.Accordion("Here are some examples you can use:", open=False):
|
104 |
+
gr.Markdown("<h3>Press one of the test examples below.<h3>")
|
105 |
+
gr.Markdown("NOTE: First time inference for a new model will take time, since a new model has to downloaded before inference.")
|
106 |
+
gr.Examples([["""Frankrike lås Sebastien Chabal har nämnts för en farlig tackling på Englands Simon Shaw under lördagens VM semifinal i Paris. Simon Shaw lastar av trots att Raphael Ibanez, vänster, och Sebastien Chabal. Sale Sharks framåt kommer att ställas inför en disciplinär utfrågning på måndag efter hans tackling på motsatt andra-rower Shaw noterades genom att citera kommissionär Dennis Wheelahan. Chabal började matchen på ersättningsbänken, men kom i 26: e minuten att ersätta den skadade Fabien Pelous under värd Frankrikes 14-9 nederlag. Om han blir avstängd missar Chabal fredagens tredje och fjärde match på Parc des Princes. Samtidigt, Frankrike tränare Bernard Laporte sade att nederlaget var svårare att ta än Englands 24-7 seger i 2003 semifinalen. "År 2003 var de bättre än oss. I själva verket var de bättre än alla", sade Laporte, som lämnar sin roll att tillträda posten som junior idrottsminister i den franska regeringen. "De var som Nya Zeeland i denna turnering - favoriten, förutom att de gick hela vägen. Den här gången är det svårare för igår var det 50-50." Samtidigt, England -- försöker bli den första nationen att försvara VM-titeln -- avslöjade att stjärna kicker Jonny Wilkinson återigen hade problem med matchbollarna under semifinalen. Flughalvan, som uttryckte sin oro efter att ha kämpat med stöveln mot Australien, avvisade en boll innan han sparkade en vital trepoängare mot Frankrike. "Vi sa det inte förra veckan men en icke-match bollen kom ut på fältet i Marseille som Jonny sparkade," chef för rugby Rob Andrew sade. "Han tänkte inte på det när han sparkade det. Matchbollarna är märkta, numrerade ett till sex. Igår kväll hade de "World Cup semifinal England vs Frankrike" skrivet på dem. På matchkvällen var Jonny vaksam när han sparkade för mål att de faktiskt var matchbollar han sparkade. "Träningsbollarna förlorar tryck och form. Hela frågan förra veckan, arrangörerna accepterade alla sex matchbollar bör användas av båda sidor på torsdagen före matchen. " E-post till en vän."""
|
107 |
+
, 5,25,120, "Gabriel/bart-base-cnn-swe"],
|
108 |
+
["""Man enades om målet för ett stimulanspaket värt nästan 39 miljoner pund som en del av den walesiska regeringens budgetavtal med liberaldemokraterna. Finansminister Jane Hutt sa att det skulle bidra till att skapa omedelbara fördelar för ekonomin. Men Plaid Cymru sade att det var "helt otillräckligt" och de konservativa sade att det skulle gå till rådet skattebetalare. Labour och Lib Dems tillkännagav ett budgetavtal på fredag kväll och avslutade veckor av förhandlingar mellan ministrar och oppositionspartier. Med 30 av församlingens 60 platser behöver Labour hjälp av minst en annan part för att godkänna sina utgiftsplaner. Den 38,9 miljoner pund stora nedgången - som skulle tillbringas över två år - utgjorde också en del av budgetdiskussionerna. Pengarna kommer från statskassan till följd av ett skattestopp i England. Ett program för att hjälpa företag att anställa unga rekryter finns bland projekt som får finansiering. Regeringen sa att en extra £4.9m skulle skapa 1800 fler lärlingsplatser. Omkring 9 miljoner pund kommer att gå till att uppgradera skolbyggnader, med samma belopp som spenderas på att leverera ytterligare 130 bostäder. Regeringen kommer att spendera £3.5 förbättra vägar på platser där den planerar att skapa företagsområden. Fem delar av Wales har öronmärkts som områden där företag kommer att få hjälp att växa. Förste minister Carwyn Jones har sagt att kopiera den brittiska regeringen genom att använda pengarna för att hålla nere rådets skatt skulle inte i någon större utsträckning gynna ekonomin, tillägger att skatteräkningar för band D hem var lägre i genomsnitt i Wales. Labour har kritiserats av motståndare, särskilt Plaid Cymru, för att inte göra tillräckligt för att reagera på en försämrad ekonomisk situation. Hutt pekade på andra åtaganden från regeringens sida som syftar till att främja tillväxten. Hon sa att hon hade övervägt förslag om att spendera pengarna från hela regeringen. Hon sade: "Detta paket bygger på dessa åtgärder för att stimulera ekonomin och utveckla offentliga tjänster, vilket ger omedelbara fördelar för vår ekonomi samtidigt som det kompletterar våra långsiktiga mål." Konservativ skuggfinansminister Paul Davies sade att han var besviken ministrar använde ytterligare resurser för att "stoppa upp" befintlig politik. Han sade: "Det finns inget nytt i detta paket annat än ett nytt försök av walesiska arbetsmarknadsministrar att agera på ekonomin, samtidigt som man spenderar pengar som skulle användas bättre av skattebetalarna själva." Welsh Lib Dem ledare Kirsty Williams sade att hennes parti kommer också att arbeta med regeringen om hur man ska spendera eventuella pengar som tilldelats Wales som ett resultat av tisdagens höst uttalande av förbundskansler George Osborne. "Wales Liberal Democrats strategi kommer att vara att fortsätta att få vår ekonomi i rörelse och förbättra livskvaliteten för människor i Wales", sade hon. Plaid Cymru ekonomi talesman Alun Ffred Jones sade: " I över sex månader har Labour lutat sig tillbaka och inte gjort någonting - utsätta Wales för den fulla kraften i denna ekonomiska kris. "Nu försöker de desperat att skapa intrycket att denna lilla summa pengar kommer att göra vad som behövs. Helt enkelt kommer det inte att göra det."""
|
109 |
+
, 5,25,120, "Gabriel/bart-base-cnn-xsum-swe"]
|
110 |
+
], [text_baseline_transformer, num_beams, min_len, max_len, model_in])
|
111 |
|
112 |
|
113 |
+
with gr.TabItem("Extractive Ranking Graph for Summarization"):
|
114 |
+
gr.Markdown(
|
115 |
+
"""Use this tab to experiment summarization task of text with a graph based method (LexRank).""")
|
116 |
+
with gr.Row():
|
117 |
+
with gr.Column(scale=4):
|
118 |
+
text_extract= gr.TextArea(label="Input Text", placeholder="Input text to summarize")
|
119 |
+
extract_button = gr.Button("Summarize!")
|
120 |
+
with gr.Column(scale=3):
|
121 |
+
with gr.Row():
|
122 |
+
ex_threshold = gr.Dropdown(['None',0.1,0.2,0.3,0.4,0.5], value='None', label="Similar Threshold")
|
123 |
+
ex_language = gr.Dropdown(["swedish","english"], value="swedish", label="Language")
|
124 |
+
model_in_ex = gr.Dropdown(["KBLab/sentence-bert-swedish-cased","sentence-transformers/all-MiniLM-L6-v2"], value="KBLab/sentence-bert-swedish-cased", label="Model")
|
125 |
+
output_extract = gr.Textbox(label="Output Text")
|
126 |
|
127 |
+
with gr.Row():
|
128 |
+
with gr.Accordion("Here are some examples you can use:", open=False):
|
129 |
+
gr.Markdown("<h3>Press one of the test examples below.<h3>")
|
130 |
+
gr.Markdown("NOTE: First time inference for a new model will take time, since a new model has to downloaded before inference.")
|
131 |
+
gr.Examples([["""Man enades om målet för ett stimulanspaket värt nästan 39 miljoner pund som en del av den walesiska regeringens budgetavtal med liberaldemokraterna. Finansminister Jane Hutt sa att det skulle bidra till att skapa omedelbara fördelar för ekonomin. Men Plaid Cymru sade att det var "helt otillräckligt" och de konservativa sade att det skulle gå till rådet skattebetalare. Labour och Lib Dems tillkännagav ett budgetavtal på fredag kväll och avslutade veckor av förhandlingar mellan ministrar och oppositionspartier. Med 30 av församlingens 60 platser behöver Labour hjälp av minst en annan part för att godkänna sina utgiftsplaner. Den 38,9 miljoner pund stora nedgången - som skulle tillbringas över två år - utgjorde också en del av budgetdiskussionerna. Pengarna kommer från statskassan till följd av ett skattestopp i England. Ett program för att hjälpa företag att anställa unga rekryter finns bland projekt som får finansiering. Regeringen sa att en extra £4.9m skulle skapa 1800 fler lärlingsplatser. Omkring 9 miljoner pund kommer att gå till att uppgradera skolbyggnader, med samma belopp som spenderas på att leverera ytterligare 130 bostäder. Regeringen kommer att spendera £3.5 förbättra vägar på platser där den planerar att skapa företagsområden. Fem delar av Wales har öronmärkts som områden där företag kommer att få hjälp att växa. Förste minister Carwyn Jones har sagt att kopiera den brittiska regeringen genom att använda pengarna för att hålla nere rådets skatt skulle inte i någon större utsträckning gynna ekonomin, tillägger att skatteräkningar för band D hem var lägre i genomsnitt i Wales. Labour har kritiserats av motståndare, särskilt Plaid Cymru, för att inte göra tillräckligt för att reagera på en försämrad ekonomisk situation. Hutt pekade på andra åtaganden från regeringens sida som syftar till att främja tillväxten. Hon sa att hon hade övervägt förslag om att spendera pengarna från hela regeringen. Hon sade: "Detta paket bygger på dessa åtgärder för att stimulera ekonomin och utveckla offentliga tjänster, vilket ger omedelbara fördelar för vår ekonomi samtidigt som det kompletterar våra långsiktiga mål." Konservativ skuggfinansminister Paul Davies sade att han var besviken ministrar använde ytterligare resurser för att "stoppa upp" befintlig politik. Han sade: "Det finns inget nytt i detta paket annat än ett nytt försök av walesiska arbetsmarknadsministrar att agera på ekonomin, samtidigt som man spenderar pengar som skulle användas bättre av skattebetalarna själva." Welsh Lib Dem ledare Kirsty Williams sade att hennes parti kommer också att arbeta med regeringen om hur man ska spendera eventuella pengar som tilldelats Wales som ett resultat av tisdagens höst uttalande av förbundskansler George Osborne. "Wales Liberal Democrats strategi kommer att vara att fortsätta att få vår ekonomi i rörelse och förbättra livskvaliteten för människor i Wales", sade hon. Plaid Cymru ekonomi talesman Alun Ffred Jones sade: " I över sex månader har Labour lutat sig tillbaka och inte gjort någonting - utsätta Wales för den fulla kraften i denna ekonomiska kris. "Nu försöker de desperat att skapa intrycket att denna lilla summa pengar kommer att göra vad som behövs. Helt enkelt kommer det inte att göra det."""
|
132 |
+
, 'None','swedish', "KBLab/sentence-bert-swedish-cased"]], [text_extract, ex_threshold, ex_language, model_in_ex])
|
133 |
|
134 |
+
with gr.Box():
|
135 |
+
gr.Markdown("<h3> Generation History <h3>")
|
136 |
+
# Displays a dataframe with the history of moves generated, with parameters
|
137 |
+
history = gr.Dataframe(headers=["In_text", "Gen_text","Sum_type" ,"Gen_model", "Parameters"], overflow_row_behaviour="show_ends", wrap=True)
|
138 |
|
139 |
+
transformer_button.click(generate_transformer, inputs=[text_baseline_transformer, num_beams, min_len, max_len, model_in ,history], outputs=[output_basline_transformer , history] )
|
140 |
+
extract_button.click(generate_lexrank, inputs=[text_extract, ex_threshold, model_in_ex, ex_language ,history], outputs=[output_extract , history] )
|
141 |
|
142 |
|
143 |
demo.launch()
|