yhavinga commited on
Commit
cda95dc
1 Parent(s): 65cf748

Update streamit, cleanup requirements, pin jax and flax, add some models

Browse files
Files changed (5) hide show
  1. README.md +1 -1
  2. app.py +12 -12
  3. default_texts.py +7 -4
  4. generator.py +2 -2
  5. requirements.txt +6 -9
README.md CHANGED
@@ -6,7 +6,7 @@ colorTo: granola
6
  sdk: streamlit
7
  app_file: app.py
8
  pinned: false
9
- sdk_version: 1.0.0
10
  license: postgresql
11
  ---
12
 
 
6
  sdk: streamlit
7
  app_file: app.py
8
  pinned: false
9
+ sdk_version: 1.25.0
10
  license: postgresql
11
  ---
12
 
app.py CHANGED
@@ -27,18 +27,18 @@ GENERATOR_LIST = [
27
  # "task": TRANSLATION_EN_TO_NL,
28
  # "split_sentences": False,
29
  # },
30
- # {
31
- # "model_name": "Helsinki-NLP/opus-mt-en-nl",
32
- # "desc": "Opus MT en->nl",
33
- # "task": TRANSLATION_EN_TO_NL,
34
- # "split_sentences": True,
35
- # },
36
- # {
37
- # "model_name": "Helsinki-NLP/opus-mt-nl-en",
38
- # "desc": "Opus MT nl->en",
39
- # "task": TRANSLATION_NL_TO_EN,
40
- # "split_sentences": True,
41
- # },
42
  # {
43
  # "model_name": "yhavinga/t5-small-24L-ccmatrix-multi",
44
  # "desc": "T5 small nl24 ccmatrix nl-en",
 
27
  # "task": TRANSLATION_EN_TO_NL,
28
  # "split_sentences": False,
29
  # },
30
+ {
31
+ "model_name": "Helsinki-NLP/opus-mt-en-nl",
32
+ "desc": "Opus MT en->nl",
33
+ "task": TRANSLATION_EN_TO_NL,
34
+ "split_sentences": True,
35
+ },
36
+ {
37
+ "model_name": "Helsinki-NLP/opus-mt-nl-en",
38
+ "desc": "Opus MT nl->en",
39
+ "task": TRANSLATION_NL_TO_EN,
40
+ "split_sentences": True,
41
+ },
42
  # {
43
  # "model_name": "yhavinga/t5-small-24L-ccmatrix-multi",
44
  # "desc": "T5 small nl24 ccmatrix nl-en",
default_texts.py CHANGED
@@ -28,17 +28,20 @@ The ISS - a joint project involving five space agencies - has been in orbit sinc
28
  "Encylopedia of Swearing (en)": {
29
  "url": "https://www.academia.edu/32398800/Encyclopedia_of_Swearing",
30
  "year": 2006,
31
- "text": """"Animal terms figure notably in the history of swearing, although they were not a major feature of Anglo-Saxon literature. The major exception was wulf, used to refer to a cruel, rapacious, or evil person, often in the title “the Devil’s wolf.” Otherwise, the chosen animals themselves are not especially dangerous or repulsive, though some are poisonous, such as the snake, and others malodorous, such as the skunk and polecat. For some cultural reason the pig provides the richest verbal field, together with the variants sow and swine. (The same pattern is seen, interestingly, in the dominance of French cochon and German schweinhund.) Swine is the oldest term in the field, being recorded in Chaucer’s richest swearing resource, the Wife of Bath, who condemns “Metellius, the foule cherl, the swyn” (Prologue l. 460). Unlike sow, swine continues to have resonance in swearing in the British Isles, especially among the older generation, while pig has become more a feature of U. S. swearing, having been especially fashionable among radical youth in the 1960s as an opprobrious term for the police.""",
32
  },
33
- "Squad Chopin (en)": {
34
  "url": "https://rajpurkar.github.io/SQuAD-explorer/",
35
  "year": 2018,
36
- "text": """Frédéric François Chopin (/˃oʊpæn; Franse uitspraak: [fʁe.de.ˁ.fʁ.swa ʃˋ.pû]; 22 februari of 1 maart 1810 – 17 oktober 1849), geboren Fryderyk Franciszek Chopin (1951), was een Pools-Franse componist (van geboorte en geboorte van zijn vader) en een virtuoos pianist uit de Romantische tijd, die voornamelijk voor de solo piano schreef. Hij verwierf wereldwijd bekendheid en heeft zich een van de belangrijkste musici van zijn tijd genoemd, wiens 'poëtische genie was gebaseerd op een professionele techniek die in zijn generatie niet te evenaren was. Chopin werd geboren in wat toen het hertogdom Warschau was en groeide op in Warschau, dat na 1815 deel werd van het Congres van Polen. Als wonderkind voltooide hij zijn muzikale opleiding en schreef zijn eerdere werken in Warschau voordat hij op 20-jarige leeftijd Polen verliet, minder dan een maand voor de uitbraak van de Novemberbeweging van 1830.""",
 
 
37
  },
38
  "Het Verboden Rijk (nl)": {
39
  "url": "https://nl.wikipedia.org/wiki/Het_Verboden_Rijk",
40
  "year": 1932,
41
- "text": """Geduldig als een dode zat ik op het dek van de boot te wachten die mij de stroom op zou varen. Het was een sombere dag. De vele kleuren van Lisboa waren verduisterd door een nevel die hoogst zelden de mond van de Taag kan vinden. Het duurde lang. Telkens kwamen nog een paar mensen of een paar vaten de plank over. Maar opeens stroomde een brede strook water tussen de stroom en de oever. Ik zag een ruiter wegrijden, ik kende zijn gelaat: een koerier, hij moest berichten dat ik veilig vertrokken was. Maar wie zou mij beletten in het water te springen en met enkele armslagen de oever weer te bereiken! Ik deed het niet, al was het gemakkelijk. Weinig wist ik dat ik later toch dien sprong zou doen om een duizendvoudigen afstand te overzwemmen, niet meer om mijn ziel, maar om mijn lichaam te redden, en een stuk papier.""",
 
42
  },
43
  "Hersenschimmen (nl)": {
44
  "url": "https://www.bibliotheek.nl/catalogus/titel.37120397X.html/hersenschimmen/",
 
28
  "Encylopedia of Swearing (en)": {
29
  "url": "https://www.academia.edu/32398800/Encyclopedia_of_Swearing",
30
  "year": 2006,
31
+ "text": """"Animal terms figure notably in the history of swearing, although they were not a major feature of Anglo-Saxon literature. The major exception was wulf, used to refer to a cruel, rapacious, or evil person, often in the title “the Devil’s wolf.” Otherwise, the chosen animals themselves are not especially dangerous or repulsive, though some are poisonous, such as the snake, and others malodorous, such as the skunk and polecat.For some cultural reason the pig provides the richest verbal field, together with the variants sow and swine. (The same pattern is seen, interestingly, in the dominance of French cochon and German schweinhund.) Swine is the oldest term in the field, being recorded in Chaucer’s richest swearing resource, the Wife of Bath, who condemns “Metellius, the foule cherl, the swyn” (Prologue l. 460). Unlike sow, swine continues to have resonance in swearing in the British Isles, especially among the older generation, while pig has become more a feature of U. S. swearing, having been especially fashionable among radical youth in the 1960s as an opprobrious term for the police.""",
32
  },
33
+ "Squad Chopin (nl)": {
34
  "url": "https://rajpurkar.github.io/SQuAD-explorer/",
35
  "year": 2018,
36
+ "text": """Frédéric François Chopin (/˃oʊpæn; Franse uitspraak: [fʁe.de.ˁ.fʁ.swa ʃˋ.pû]; 22 februari of 1 maart 1810 – 17 oktober 1849), geboren Fryderyk Franciszek Chopin (1951), was een Pools-Franse componist (van geboorte en geboorte van zijn vader) en een virtuoos pianist uit de Romantische tijd, die voornamelijk voor de solo piano schreef.
37
+ Hij verwierf wereldwijd bekendheid en heeft zich een van de belangrijkste musici van zijn tijd genoemd, wiens 'poëtische genie was gebaseerd op een professionele techniek die in zijn generatie niet te evenaren was. Chopin werd geboren in wat toen het hertogdom Warschau was en groeide op in Warschau, dat na 1815 deel werd van het Congres van Polen.
38
+ Als wonderkind voltooide hij zijn muzikale opleiding en schreef zijn eerdere werken in Warschau voordat hij op 20-jarige leeftijd Polen verliet, minder dan een maand voor de uitbraak van de Novemberbeweging van 1830.""",
39
  },
40
  "Het Verboden Rijk (nl)": {
41
  "url": "https://nl.wikipedia.org/wiki/Het_Verboden_Rijk",
42
  "year": 1932,
43
+ "text": """Geduldig als een dode zat ik op het dek van de boot te wachten die mij de stroom op zou varen. Het was een sombere dag. De vele kleuren van Lisboa waren verduisterd door een nevel die hoogst zelden de mond van de Taag kan vinden. Het duurde lang. Telkens kwamen nog een paar mensen of een paar vaten de plank over. Maar opeens stroomde een brede strook water tussen de stroom en de oever.
44
+ Ik zag een ruiter wegrijden, ik kende zijn gelaat: een koerier, hij moest berichten dat ik veilig vertrokken was. Maar wie zou mij beletten in het water te springen en met enkele armslagen de oever weer te bereiken! Ik deed het niet, al was het gemakkelijk. Weinig wist ik dat ik later toch dien sprong zou doen om een duizendvoudigen afstand te overzwemmen, niet meer om mijn ziel, maar om mijn lichaam te redden, en een stuk papier.""",
45
  },
46
  "Hersenschimmen (nl)": {
47
  "url": "https://www.bibliotheek.nl/catalogus/titel.37120397X.html/hersenschimmen/",
generator.py CHANGED
@@ -1,3 +1,4 @@
 
1
  import os
2
  import re
3
 
@@ -18,12 +19,11 @@ def get_access_token():
18
  return access_token
19
 
20
 
21
- @st.cache(suppress_st_warning=True, allow_output_mutation=True)
22
  def load_model(model_name):
23
  os.environ.setdefault("TOKENIZERS_PARALLELISM", "false")
24
  tokenizer = AutoTokenizer.from_pretrained(
25
  model_name,
26
- from_flax=True,
27
  use_fast=("ul2" not in model_name),
28
  use_auth_token=get_access_token(),
29
  )
 
1
+ import _thread
2
  import os
3
  import re
4
 
 
19
  return access_token
20
 
21
 
22
+ # @st.cache(hash_funcs={_thread.RLock: lambda _: None}, suppress_st_warning=True, allow_output_mutation=True)
23
  def load_model(model_name):
24
  os.environ.setdefault("TOKENIZERS_PARALLELISM", "false")
25
  tokenizer = AutoTokenizer.from_pretrained(
26
  model_name,
 
27
  use_fast=("ul2" not in model_name),
28
  use_auth_token=get_access_token(),
29
  )
requirements.txt CHANGED
@@ -1,14 +1,11 @@
1
- #-f https://download.pytorch.org/whl/torch_stable.html
2
- -f https://download.pytorch.org/whl/cu116
3
- -f https://storage.googleapis.com/jax-releases/jax_cuda_releases.html
4
- protobuf<3.20
5
- streamlit>=1.4.0,<=1.10.0
6
  torch
7
- git+https://github.com/huggingface/transformers.git@1905384fd576acf4b645a8216907f980b4788d9b
8
  langdetect
9
  psutil
10
- jax[cuda]==0.3.16
 
11
  chex>=0.1.4
12
- ##jaxlib==0.1.67
13
- flax>=0.5.3
14
  sentencepiece
 
 
1
+ streamlit
 
 
 
 
2
  torch
3
+ transformers
4
  langdetect
5
  psutil
6
+ jax<0.4.0
7
+ jaxlib<0.4.0
8
  chex>=0.1.4
9
+ flax<0.6.0
 
10
  sentencepiece
11
+ nltk