bigscience/bloom · Possible bug to look into?

Aug 30, 2022

Not sure if there's any need or any kind of bug reporting, but here, have a look.

My prompt:
"Q: What is a virtue?"
"A:"

My setup:
import time

def infer(prompt,
max_length = 128,
top_k = 0,
num_beams = 0,
no_repeat_ngram_size = 2,
top_p = 0.9,
seed=42,
temperature=0.7,
greedy_decoding = False,
return_full_text = False):

top_k = None if top_k == 0 else top_k
do_sample = False if num_beams > 0 else not greedy_decoding
num_beams = None if (greedy_decoding or num_beams == 0) else num_beams
no_repeat_ngram_size = None if num_beams is None else no_repeat_ngram_size
top_p = None if num_beams else top_p
early_stopping = None if num_beams is None else num_beams > 0

params = {
    "max_new_tokens": max_length,
    "top_k": top_k,
    "top_p": top_p,
    "temperature": temperature,
    "do_sample": do_sample,
    "seed": seed,
    "early_stopping":early_stopping,
    "no_repeat_ngram_size":no_repeat_ngram_size,
    "num_beams":num_beams,
    "return_full_text":return_full_text
}

s = time.time()
response = inference(prompt, params=params)
#print(response)
proc_time = time.time()-s
#print(f"Processing time was {proc_time} seconds")
return response

stellaathena

BigScience Workshop org Aug 31, 2022

I don't see any reason to assume this is a bug. Language models are not guaranteed to produce high quality text and frequently get caught in loops like this

norrr changed discussion status to closed Aug 31, 2022