prevent repetitions

by vinnitu - opened May 2, 2023

May 2, 2023

How to prevent repetitions like "It's working"?

from transformers import MBartForConditionalGeneration, MBart50TokenizerFast
import torch

device = torch.device('cuda')

max_new_tokens = 200
model_name = "facebook/mbart-large-50-many-to-one-mmt"
model = MBartForConditionalGeneration.from_pretrained(model_name).to(device)
tokenizer = MBart50TokenizerFast.from_pretrained(model_name)
tokenizer.src_lang = 'ko_KR'
input = '서비스 중지가 계속 뜨는데 잘 된거 맞나요?' # google translation is: 'The service stop keeps popping up, is it okay?'
encoded = tokenizer(input, return_tensors="pt").to(device)
generated_tokens = model.generate(**encoded)
result = tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)
print(return result[0])

And it's working, right? It's working. It's working. It's working. It's working. It's working. It's working. It's working. It's working. It's working. It's working. It's working. It's working. It's working. It's working. It's working. It's working. It's working. It's working. It's working. It's working. It's working. It's working. It's working. It's working. It's working. It's working. It's working. It's working. It's working. It's working. It's working. It's working. It's working. It's working. It's working. It's working. It's working. It's working

taesiri

May 3, 2023

Hello @vinnitu

You can use no_repeat_ngram_size (doc) to prevent such repetition.

Code:

from transformers import MBartForConditionalGeneration, MBart50TokenizerFast
import torch

device = torch.device('cuda')

max_new_tokens = 200
model_name = "facebook/mbart-large-50-many-to-one-mmt"
model = MBartForConditionalGeneration.from_pretrained(model_name).to(device)
tokenizer = MBart50TokenizerFast.from_pretrained(model_name)
tokenizer.src_lang = 'ko_KR'

input = '서비스 중지가 계속 뜨는데 잘 된거 맞나요?' 
encoded = tokenizer(input, return_tensors="pt").to(device)

# Adjust the num_beams and no_repeat_ngram_size parameters
generated_tokens = model.generate(
    **encoded,
    num_beams=5,
    no_repeat_ngram_size=2,
    max_length=max_new_tokens,
)

result = tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)
print(result[0])

Output:

And it's working, right?

vinnitu

May 3, 2023

thanks

vinnitu changed discussion status to closed May 3, 2023

Upload images, audio, and videos by dragging in the text input, pasting, or clicking here.

Tap or paste here to upload images

· Sign up or log in to comment