facebook
/

wmt21-dense-24-wide-x-en

text2text-generation

Model card Files Files and versions Community

chtran commited on Nov 23, 2021

Commit

d444583

·

1 Parent(s): 131f4db

Update README.md

Files changed (1) hide show

README.md +5 -2

README.md CHANGED Viewed

@@ -17,6 +17,9 @@ To force the target language id as the first generated token, pass the `forced_b
 *Note: `M2M100Tokenizer` depends on `sentencepiece`, so make sure to install it before running the example.*
 To install `sentencepiece` run `pip install sentencepiece`
 ```python
 from transformers import AutoModelForSeq2SeqLM, AutoTokenizer
@@ -26,14 +29,14 @@ tokenizer = AutoTokenizer.from_pretrained("facebook/wmt21-dense-24-wide-x-en")
 # translate German to English
 tokenizer.src_lang = "de"
-inputs = tokenizer("Ein Modell für viele Sprachen", return_tensors="pt")
 generated_tokens = model.generate(**inputs)
 tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)
 # => "A model for many languages"
 # translate Icelandic to English
 tokenizer.src_lang = "is"
-inputs = tokenizer("Ein fyrirmynd fyrir mörg tungumál", return_tensors="pt")
 generated_tokens = model.generate(**inputs)
 tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)
 # => "One model for many languages"

 *Note: `M2M100Tokenizer` depends on `sentencepiece`, so make sure to install it before running the example.*
 To install `sentencepiece` run `pip install sentencepiece`
+Since the model was trained with domain tags, you should prepend them to the input as well.
+* "wmtdata newsdomain": Use for sentences in the news domain
+* "wmtdata otherdomain": Use for sentences in all other domain
 ```python
 from transformers import AutoModelForSeq2SeqLM, AutoTokenizer
 # translate German to English
 tokenizer.src_lang = "de"
+inputs = tokenizer("wmtdata newsdomain Ein Modell für viele Sprachen", return_tensors="pt")
 generated_tokens = model.generate(**inputs)
 tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)
 # => "A model for many languages"
 # translate Icelandic to English
 tokenizer.src_lang = "is"
+inputs = tokenizer("wmtdata newsdomain Ein fyrirmynd fyrir mörg tungumál", return_tensors="pt")
 generated_tokens = model.generate(**inputs)
 tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)
 # => "One model for many languages"