Spaces:

ftakelait
/

da_en_translation

Running

Fouzi Takelait commited on May 3, 2022

Commit

0dfd702

•

1 Parent(s): b1c0f8d

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -23,11 +23,7 @@ from transformer_mt_roberta.modeling_transformer_final import TransfomerEncoderD
 #     source_tokenizer = PreTrainedTokenizerFast.from_pretrained("da_en_output_dir/da_tokenizer")
 #     target_tokenizer = PreTrainedTokenizerFast.from_pretrained("da_en_output_dir/en_tokenizer")
 #     model = TransfomerEncoderDecoderModel.from_pretrained("da_en_output_dir")
-<<<<<<< HEAD
-#
-=======
-#
->>>>>>> adb80531e202c58b4ab91375bc391ab50bbc882f
 #     input_ids = source_tokenizer.encode(text_in, return_tensors="pt")
 #     output_ids = model.generate(
 #         input_ids,
@@ -36,11 +32,7 @@ from transformer_mt_roberta.modeling_transformer_final import TransfomerEncoderD
 #         eos_token_id=target_tokenizer.eos_token_id,
 #         pad_token_id=target_tokenizer.pad_token_id,
 #      )
-<<<<<<< HEAD
-#
-=======
-#
->>>>>>> adb80531e202c58b4ab91375bc391ab50bbc882f
 #     return target_tokenizer.decode(output_ids[0])
 def translator_fn_roberta(text_in):
@@ -49,7 +41,7 @@ def translator_fn_roberta(text_in):
     model_pretrained_roberta = mt_roberta.from_pretrained("da_en_RoBERTa_pretrained")
     input_ids_pretrained_roberta = source_tokenizer_pretrained_roberta.encode(text_in, return_tensors="pt")
-    output_ids_pretrained_roberta = input_ids_pretrained_roberta.generate(
         input_ids_pretrained_roberta,
         max_length=10,
         bos_token_id=target_tokenizer_pretrained_roberta.bos_token_id,

 #     source_tokenizer = PreTrainedTokenizerFast.from_pretrained("da_en_output_dir/da_tokenizer")
 #     target_tokenizer = PreTrainedTokenizerFast.from_pretrained("da_en_output_dir/en_tokenizer")
 #     model = TransfomerEncoderDecoderModel.from_pretrained("da_en_output_dir")
 #     input_ids = source_tokenizer.encode(text_in, return_tensors="pt")
 #     output_ids = model.generate(
 #         input_ids,
 #         eos_token_id=target_tokenizer.eos_token_id,
 #         pad_token_id=target_tokenizer.pad_token_id,
 #      )
 #     return target_tokenizer.decode(output_ids[0])
 def translator_fn_roberta(text_in):
     model_pretrained_roberta = mt_roberta.from_pretrained("da_en_RoBERTa_pretrained")
     input_ids_pretrained_roberta = source_tokenizer_pretrained_roberta.encode(text_in, return_tensors="pt")
+    output_ids_pretrained_roberta = model_pretrained_roberta.generate(
         input_ids_pretrained_roberta,
         max_length=10,
         bos_token_id=target_tokenizer_pretrained_roberta.bos_token_id,