pere commited on
Commit
8e03cef
1 Parent(s): 58dedc3

Fixed mixup

Browse files
Files changed (2) hide show
  1. README.md +3 -3
  2. app.py +18 -6
README.md CHANGED
@@ -1,7 +1,7 @@
1
  ---
2
- title: Spurningen
3
- emoji: 🗣
4
- colorFrom: red
5
  colorTo: purple
6
  sdk: streamlit
7
  app_file: app.py
1
  ---
2
+ title: Nb2nn
3
+ emoji: 🏃
4
+ colorFrom: green
5
  colorTo: purple
6
  sdk: streamlit
7
  app_file: app.py
app.py CHANGED
@@ -4,7 +4,7 @@ import time
4
  import requests
5
  import streamlit as st
6
 
7
- API_URL = "https://api-inference.huggingface.co/models/NbAiLab/norwegian-gpt2-vgd"
8
 
9
 
10
  def translate(text, wait=True):
@@ -40,21 +40,33 @@ def translate(text, wait=True):
40
 
41
 
42
  st.set_page_config(
43
- page_title='Spurningen',
44
  page_icon='translator-icon.png',
45
  )
46
  st.title("Bokmål ⇔ Nynorsk")
47
  st.sidebar.title("Translation Demo")
48
  st.sidebar.write("""
49
- Spurningen (P.Chr. Asbjørnsen og Jørgen Moe Norske folkeeventyr (1852). I senere utgaver er eventyret kalt "Prinsessen som ingen kunde målbinde". Spurning er et gammelt norrønt ord for gåte. En spurning er en utspørring. Denne GPT2-modellen er trent aviser, wikipedia og diverse sosiale media. Bl.a. er den trent spørsmål og svar fra VGDebatt. Den er trent for å ikke la seg målbinde!
 
50
 
51
- Dette er en demo-versjon hovedsakelig ment for forskning på auto-regressive språkmodeller. Det er ingen filter-funksjon her. Modellen kan godt generere tekst som i en annen kontekst kan være ekstremt fornærmende. Husk at dette er en lek med sammensetning av ord. Ikke la deg fornærme.
 
 
 
 
 
 
 
 
 
 
52
 
 
 
53
  """)
54
 
55
-
56
  text = st.text_area(" ",
57
- "Nasjonalbibliotekets AI-lab har faktisk utviklet et språkmodell som ikke kan målbindes. Hvor tror dere dette ender?",
58
  height=None,
59
  max_chars=None,
60
  key=None,
4
  import requests
5
  import streamlit as st
6
 
7
+ API_URL = "https://api-inference.huggingface.co/models/pere/nb-nn-translation"
8
 
9
 
10
  def translate(text, wait=True):
40
 
41
 
42
  st.set_page_config(
43
+ page_title='Norwegian Bokmål to Nynorsk',
44
  page_icon='translator-icon.png',
45
  )
46
  st.title("Bokmål ⇔ Nynorsk")
47
  st.sidebar.title("Translation Demo")
48
  st.sidebar.write("""
49
+ Here are some sample texts in Norwegian Bokmål and Norwegian Nynorsk that you can try to translate. They are here presented in pairs (Bokmål, Nynorsk, Bokmål...). This way you can also see a suggested translation of the text. The model will automatically understand if the input is in Nynorsk or Bokmål, and switch the translation.
50
+ """)
51
 
52
+ masked_texts = [
53
+ "Hvordan kan man lære maskinen å oversette?",
54
+ "Korleis kan ein lære maskinen å omsetje?"
55
+ "Hun vil ikke gi bort sine personlige data.",
56
+ "Ho vil ikkje gi bort dei personlege dataa sine.",
57
+ "Bilen er rød. Den er rask, og hun kjører den veldig raskt.",
58
+ "Bilen er raud. Han er rask, og ho køyrer han veldig raskt..",
59
+ "De ventes å ankomme ganske snart.",
60
+ "Dei blir venta å komme ganske snart.",
61
+ ]
62
+ input_text = st.sidebar.selectbox("Select a Text", options=masked_texts)
63
 
64
+ st.sidebar.write("""
65
+ As you can see there are a lot of similarities between the languages. Since there also are some grammatical differences, simple dictionary replacements do not give a good result. A finetuned model on top of a pretrained t5-base from a balanced corpus, seem to solve the task with a SACREBLEU-score of 88.17.
66
  """)
67
 
 
68
  text = st.text_area(" ",
69
+ input_text,
70
  height=None,
71
  max_chars=None,
72
  key=None,