Spaces:

ftakelait
/

da_en_translation

Sleeping

App Files Files Community

Fouzi Takelait commited on May 3, 2022

Commit

5476c3d

•

1 Parent(s): a35448d

Update app.py

Browse files

Files changed (1) hide show

app.py +17 -17

app.py CHANGED Viewed

@@ -19,21 +19,21 @@ from transformer_mt_roberta.modeling_transformer_final import TransfomerEncoderD
 #    results = translation_pipeline(text_input)
 #    return results[0]['translation_text']
-# def translator_fn_baseline(text_in):
-#     source_tokenizer = PreTrainedTokenizerFast.from_pretrained("da_en_output_dir/da_tokenizer")
-#     target_tokenizer = PreTrainedTokenizerFast.from_pretrained("da_en_output_dir/en_tokenizer")
-#     model = TransfomerEncoderDecoderModel.from_pretrained("da_en_output_dir")
-#     input_ids = source_tokenizer.encode(text_in, return_tensors="pt")
-#     output_ids = model.generate(
-#         input_ids,
-#         max_length=10,
-#         bos_token_id=target_tokenizer.bos_token_id,
-#         eos_token_id=target_tokenizer.eos_token_id,
-#         pad_token_id=target_tokenizer.pad_token_id,
-#      )
-#     return target_tokenizer.decode(output_ids[0])
 def translator_fn_roberta(text_in):
     source_tokenizer_pretrained_roberta = AutoTokenizer.from_pretrained("flax-community/roberta-base-danish")
@@ -50,9 +50,9 @@ def translator_fn_roberta(text_in):
      )
     return target_tokenizer_pretrained_roberta.decode(output_ids_pretrained_roberta[0])
-iface = gr.Interface(fn=translator_fn_roberta,
                      inputs=gr.inputs.Textbox(lines=2, placeholder=None, label="Your Danish text goes here."),
-                     outputs=['text'],   # a list should match the number of values returned by fn to have one input and 2 putputs.
                      description = "This App translates text from Danish to the English language.",
                      title = "Danish to English Translator App",
                      theme = "peach")

 #    results = translation_pipeline(text_input)
 #    return results[0]['translation_text']
+def translator_fn_baseline(text_in):
+     source_tokenizer = PreTrainedTokenizerFast.from_pretrained("da_en_output_dir/da_tokenizer")
+     target_tokenizer = PreTrainedTokenizerFast.from_pretrained("da_en_output_dir/en_tokenizer")
+     model = TransfomerEncoderDecoderModel.from_pretrained("da_en_output_dir")
+     input_ids = source_tokenizer.encode(text_in, return_tensors="pt")
+     output_ids = model.generate(
+         input_ids,
+         max_length=10,
+         bos_token_id=target_tokenizer.bos_token_id,
+         eos_token_id=target_tokenizer.eos_token_id,
+         pad_token_id=target_tokenizer.pad_token_id,
+      )
+     return target_tokenizer.decode(output_ids[0])
 def translator_fn_roberta(text_in):
     source_tokenizer_pretrained_roberta = AutoTokenizer.from_pretrained("flax-community/roberta-base-danish")
      )
     return target_tokenizer_pretrained_roberta.decode(output_ids_pretrained_roberta[0])
+iface = gr.Interface(fn=[translator_fn_baseline, translator_fn_roberta],
                      inputs=gr.inputs.Textbox(lines=2, placeholder=None, label="Your Danish text goes here."),
+                     outputs=['text', 'text'],   # a list should match the number of values returned by fn to have one input and 2 putputs.
                      description = "This App translates text from Danish to the English language.",
                      title = "Danish to English Translator App",
                      theme = "peach")