Yeb Havinga commited on
Commit
d92c39b
1 Parent(s): fd2c867

Update text. Switch default top Top-K sampling

Browse files
Files changed (1) hide show
  1. app.py +9 -11
app.py CHANGED
@@ -8,16 +8,14 @@ from transformers import set_seed
8
 
9
  debug = False
10
 
11
- test_commit = True
12
-
13
  MODEL = "flax-community/t5-base-dutch-demo"
14
  # MODEL: str = "."
15
 
16
- DEFAULT_TEXT: str = """De Japanse onderzoekers gebruikten geavanceerde glasvezeltechnologie om de hoge snelheid te halen. Hiervoor werd onder meer gebruikgemaakt van zeldzame mineralen en een zogeheten microkam, waarbij laserstralen in bundels worden afgeschoten.
17
- Het NICT simuleerde de data op zo'n manier dat de downloadsnelheid over een gebied van 3.000 kilometer kon worden gemeten. Over die afstand werd door de onderzoekers geen vertraging in de snelheid of verzwakking in het signaal gemeten.
18
- Met een snelheid van 319 Tb/s zouden 57.000 films per seconde kunnen worden gedownload of de gehele Spotify-bibliotheek in drie seconden, schrijft Yahoo News.
19
- Voorlopig lijkt de techniek overigens niet meer te zijn dan een experiment, vanwege de hoge kosten die ermee zijn gemoeid. In Nederland zijn providers bezig met het aanleggen van internet met een hoge downloadsnelheid. Deze glasvezelnetwerken bereiken snelheden tot 1 gigabit per seconde.
20
- """
21
 
22
 
23
  class TextSummarizer:
@@ -81,14 +79,14 @@ def main():
81
  """# Netherformer
82
  * Create summaries of Dutch news stories.
83
  * Copy paste any Dutch news text and press the Generate Summary botton.
84
- * This demo the [T5 Dutch finetuned on CNN DM](https://huggingface.co/flax-community/t5-base-dutch-demo)
85
  transformer model. Please refer to the [model page](https://huggingface.co/flax-community/t5-base-dutch-demo) for more information.
86
  """
87
  )
88
  st.sidebar.title("Parameters:")
89
 
90
  min_length = st.sidebar.number_input(
91
- "Min length", min_value=10, max_value=150, value=30
92
  )
93
  max_length = st.sidebar.number_input(
94
  "Max length", min_value=50, max_value=250, value=142
@@ -98,7 +96,7 @@ transformer model. Please refer to the [model page](https://huggingface.co/flax-
98
  )
99
 
100
  if sampling_mode := st.sidebar.selectbox(
101
- "select a Mode", index=0, options=["Beam Search", "Top-k Sampling"]
102
  ):
103
  if sampling_mode == "Beam Search":
104
  num_beams = st.sidebar.number_input(
@@ -124,7 +122,7 @@ transformer model. Please refer to the [model page](https://huggingface.co/flax-
124
  "Top P", min_value=0.0, max_value=1.0, value=0.9, step=0.05
125
  )
126
  temperature = st.sidebar.number_input(
127
- "Temperature", min_value=0.0, max_value=1.0, value=1.0, step=0.05
128
  )
129
  params = {
130
  "min_length": min_length,
 
8
 
9
  debug = False
10
 
 
 
11
  MODEL = "flax-community/t5-base-dutch-demo"
12
  # MODEL: str = "."
13
 
14
+ DEFAULT_TEXT: str = """De voorzitter en CEO van de Amerikaanse tabaksfabrikant Philip Morris vinden dat de Britse overheid sigaretten in de komende tien jaar moet verbieden. "Wij zien een wereld zonder sigaretten voor ons", zegt CEO Jacek Olczak tegen de Britse krant The Telegraph. "En hoe sneller sigaretten verdwijnen, hoe beter, voor iedereen."
15
+ Volgens voorzitter André Calantzopoulos is het belangrijk dat overheden duidelijk zijn over een toekomstig verbod op sigaretten. Hij denkt dat rokers en bedrijven veel kunnen hebben aan een deadline. "Door een deadline te geven, weten mensen beter waar hun horizon ligt."
16
+ "Het verschilt niet zoveel van wat je nu ziet met benzineauto's en alternatieven daarop", zegt hij. De verkoop van nieuwe benzineauto's wordt in de EU waarschijnlijk per 2035 verboden. "De overheid moet de verwarring die nu heerst bij veel rokers tot een einde brengen."
17
+ Olczak denkt dat veel mensen op dit moment nog geloven dat de alternatieven voor roken ongezonder zijn dan een sigaret. Hij denkt dat overheden beter hun best moeten doen om mensen daarover voor te lichten, en om ze een alternatief op de sigaret te bieden. "Met goede wetgeving en voorlichting kun je in sommige landen al binnen tien jaar sigaretten verbieden", zegt hij. "En dan ben je voor eens en altijd van het probleem af."
18
+ Philip Morris is het bedrijf achter de sigaretten van Marlboro. Hoewel het bedrijf groot is geworden als tabaksfabrikant, wil het zich steeds meer op andere zaken richten. Het heeft zichzelf als doel gesteld om de helft van de omzet uit andere producten dan sigaretten te halen, om uiteindelijk een bedrijf te worden dat zich richt op gezondheid en welzijn."""
19
 
20
 
21
  class TextSummarizer:
 
79
  """# Netherformer
80
  * Create summaries of Dutch news stories.
81
  * Copy paste any Dutch news text and press the Generate Summary botton.
82
+ * This is a demo of the [T5 Dutch finetuned on CNN DM and XSUM](https://huggingface.co/flax-community/t5-base-dutch-demo)
83
  transformer model. Please refer to the [model page](https://huggingface.co/flax-community/t5-base-dutch-demo) for more information.
84
  """
85
  )
86
  st.sidebar.title("Parameters:")
87
 
88
  min_length = st.sidebar.number_input(
89
+ "Min length", min_value=10, max_value=150, value=75
90
  )
91
  max_length = st.sidebar.number_input(
92
  "Max length", min_value=50, max_value=250, value=142
 
96
  )
97
 
98
  if sampling_mode := st.sidebar.selectbox(
99
+ "select a Mode", index=0, options=["Top-k Sampling", "Beam Search"]
100
  ):
101
  if sampling_mode == "Beam Search":
102
  num_beams = st.sidebar.number_input(
 
122
  "Top P", min_value=0.0, max_value=1.0, value=0.9, step=0.05
123
  )
124
  temperature = st.sidebar.number_input(
125
+ "Temperature", min_value=0.0, max_value=1.0, value=0.3, step=0.05
126
  )
127
  params = {
128
  "min_length": min_length,