translate-to-any-language

Sleeping

App Files Files Community

MihaiHuggingFace commited on Oct 3, 2024

Commit

d1882a9

verified ·

1 Parent(s): 2a6c353

Update app.py

Browse files

Files changed (1) hide show

app.py +17 -35

app.py CHANGED Viewed

@@ -6,10 +6,17 @@ device = "cuda:0" if torch.cuda.is_available() else "cpu"
 LANG_CODES = {
     "English":"en",
-    "Toki Pona":"tl",
     "Romanian":"ro"
 }
 def translate(text, src_lang, tgt_lang, candidates:int):
     """
     Translate the text from source lang to target lang
@@ -18,25 +25,6 @@ def translate(text, src_lang, tgt_lang, candidates:int):
     src = LANG_CODES.get(src_lang)
     tgt = LANG_CODES.get(tgt_lang)
-    if tgt == tl and src == en:
-        model = AutoModelForSeq2SeqLM.from_pretrained("Jayyydyyy/m2m100_418m_tokipona").to(device)
-        tokenizer = AutoTokenizer.from_pretrained("facebook/m2m100_418M")
-    elif tgt == en and src == tl:
-        model = AutoModelForSeq2SeqLM.from_pretrained("Jayyydyyy/m2m100_418m_tokipona").to(device)
-        tokenizer = AutoTokenizer.from_pretrained("facebook/m2m100_418M")
-    elif tgt == en and src == en:
-        model = AutoModelForSeq2SeqLM.from_pretrained("Jayyydyyy/m2m100_418m_tokipona").to(device)
-        tokenizer = AutoTokenizer.from_pretrained("facebook/m2m100_418M")
-    elif tgt == tl and src == tl:
-        model = AutoModelForSeq2SeqLM.from_pretrained("Jayyydyyy/m2m100_418m_tokipona").to(device)
-        tokenizer = AutoTokenizer.from_pretrained("facebook/m2m100_418M")
-    elif tgt == en and src == ro:
-        model = AutoModelForSeq2SeqLM.from_pretrained("facebook/m2m100_418M").to(device)
-        tokenizer = AutoTokenizer.from_pretrained("facebook/m2m100_418M")
-    elif tgt == ro and src == en:
-        model = AutoModelForSeq2SeqLM.from_pretrained("facebook/m2m100_418M").to(device)
-        tokenizer = AutoTokenizer.from_pretrained("facebook/m2m100_418M")
     tokenizer.src_lang = src
     tokenizer.tgt_lang = tgt
@@ -68,12 +56,10 @@ with gr.Blocks() as app:
     Input your text to translate, a source language and target language, and desired number of return sequences!
-    Right now, this only supports 3 languages. I will add more later! So stay tuned!
     ### Model and Data
-    This app utilizes BOTH a fine-tuned version of Facebook/Meta AI's M2M100 418M param model for Toki Pona and the original for other languages.
-    The Toki Pona variant of the model was fine-tuned on the English/toki pona bitexts found at [https://tatoeba.org/](https://tatoeba.org/)
     ### This app is a machine and not all translations will be perfect.
     """
@@ -81,27 +67,23 @@ with gr.Blocks() as app:
     with gr.Row():
         gr.Markdown(markdown)
         with gr.Column():
-            input_text = gr.components.Textbox(label="Input Text", value="Toad (Pit Crew) is a fun character you can try in Mario Kart Tour! Wow!")
             source_lang = gr.components.Dropdown(label="Source Language", value="English", choices=list(LANG_CODES.keys()))
-            target_lang = gr.components.Dropdown(label="Target Language", value="toki pona", choices=list(LANG_CODES.keys()))
             return_seqs = gr.Slider(label="Number of return sequences", value=3, minimum=1, maximum=128, step=1)
             inputs=[input_text, source_lang, target_lang, return_seqs]
             outputs = gr.Textbox()
-            translate_btn = gr.Button("Translate! | o ante toki!")
             translate_btn.click(translate, inputs=inputs, outputs=outputs)
             gr.Examples(
                 [
-                    ["Hello! How are you?", "English", "Toki Pona", 3],
-                    ["toki a! ilo pi ante toki ni li pona!", "Toki Pona", "English",  3],
-                    ["mi li toki e toki pona", "Toki Pona", "Toki Pona", 3],
-                    ["It's a good music generated by AI.", "English", "English", 3],
-                    ["I love this tool!", "English", "Toki Pona", 3],
-                    ["toki pona li toki pona.", "Toki Pona", "English",  3],
-                    ["pona toki a", "Toki Pona", "Toki Pona", 3],
-                    ["I want some bread and rice.", "English", "English", 3],
                 ],
                 inputs=inputs
             )

 LANG_CODES = {
     "English":"en",
     "Romanian":"ro"
+    "Spanish":"es"
+    "Italian":"it"
+    "German":"de"
+    "Portugese":"pt"
+    "French":"fr"
 }
+model = AutoModelForSeq2SeqLM.from_pretrained("facebook/m2m100_418M").to(device)
+tokenizer = AutoTokenizer.from_pretrained("facebook/m2m100_418M")
 def translate(text, src_lang, tgt_lang, candidates:int):
     """
     Translate the text from source lang to target lang
     src = LANG_CODES.get(src_lang)
     tgt = LANG_CODES.get(tgt_lang)
     tokenizer.src_lang = src
     tokenizer.tgt_lang = tgt
     Input your text to translate, a source language and target language, and desired number of return sequences!
+    Right now, this only supports 7 languages. I will add more later! So stay tuned!
     ### Model and Data
+    This app uses Facebook/Meta AI's M2M100 418M param model for translation.
     ### This app is a machine and not all translations will be perfect.
     """
     with gr.Row():
         gr.Markdown(markdown)
         with gr.Column():
+            input_text = gr.components.Textbox(label="Input Text", value="Hello, world! Have a nice day!")
             source_lang = gr.components.Dropdown(label="Source Language", value="English", choices=list(LANG_CODES.keys()))
+            target_lang = gr.components.Dropdown(label="Target Language", value="Romanian", choices=list(LANG_CODES.keys()))
             return_seqs = gr.Slider(label="Number of return sequences", value=3, minimum=1, maximum=128, step=1)
             inputs=[input_text, source_lang, target_lang, return_seqs]
             outputs = gr.Textbox()
+            translate_btn = gr.Button("Translate!")
             translate_btn.click(translate, inputs=inputs, outputs=outputs)
             gr.Examples(
                 [
+                    ["Hello! How are you?", "English", "Romanian", 3],
+                    ["Mă numesc Popa Mihai și am 13 ani.", "Romanian", "English",  3],
+                    ["Tu vreau cafea.", "Romanian", "Toki Pona", 3],
+                    ["Do you needs coffee?", "English", "English", 3],
                 ],
                 inputs=inputs
             )