Spaces:

BEE-spoke-data
/

beecoder-playground

Sleeping

pszemraj commited on Nov 1, 2023

Commit

c2e8e0a

1 Parent(s): 5a475bb

⚡️ add min temp and epsilon_cutoff

Signed-off-by: peter szemraj <peterszemraj@gmail.com>

Files changed (1) hide show

app.py CHANGED Viewed

@@ -4,7 +4,7 @@ from gradio.themes.utils import sizes
 from transformers import AutoModelForCausalLM, AutoTokenizer
 import utils
-from constants import END_OF_TEXT
 # Load the tokenizer and model
 tokenizer = AutoTokenizer.from_pretrained(
@@ -55,13 +55,13 @@ def run_inference(
     outputs = model.generate(
         **inputs,
         do_sample=True,
-        # early_stopping=True,
         max_new_tokens=max_new_tokens,
         min_new_tokens=2,
         no_repeat_ngram_size=6,
         renormalize_logits=True,
         repetition_penalty=repetition_penalty,
-        temperature=temperature,
         top_p=top_p,
     )
     text = tokenizer.batch_decode(

 from transformers import AutoModelForCausalLM, AutoTokenizer
 import utils
+from constants import END_OF_TEXT, MIN_TEMPERATURE
 # Load the tokenizer and model
 tokenizer = AutoTokenizer.from_pretrained(
     outputs = model.generate(
         **inputs,
         do_sample=True,
+        epsilon_cutoff=1e-3,
         max_new_tokens=max_new_tokens,
         min_new_tokens=2,
         no_repeat_ngram_size=6,
         renormalize_logits=True,
         repetition_penalty=repetition_penalty,
+        temperature=max(temperature, MIN_TEMPERATURE)
         top_p=top_p,
     )
     text = tokenizer.batch_decode(