cameltech
/

japanese-gpt-1b-PII-masking

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

ksuzuki01 commited on May 17

Commit

8bbc9d2

•

1 Parent(s): 1a6b2d0

Update README.md

Files changed (1) hide show

README.md +12 -4

README.md CHANGED Viewed

@@ -65,7 +65,17 @@ def preprocess(text):
 def postprocess(text):
     return text.replace("<LB>", "\n")
 input_text += "<SEP>"
 input_text = preprocess(input_text)
@@ -74,9 +84,7 @@ with torch.no_grad():
     output_ids = model.generate(
         token_ids.to(model.device),
-        max_new_tokens=256,
-        pad_token_id=tokenizer.pad_token_id,
-        eos_token_id=tokenizer.eos_token_id,
     )
 output = tokenizer.decode(output_ids.tolist()[0][token_ids.size(1) :], skip_special_tokens=True)
 output = postprocess(output)

 def postprocess(text):
     return text.replace("<LB>", "\n")
+generation_config = {
+    "max_new_tokens": 256,
+    "num_beams": 3,
+    "num_return_sequences": 1,
+    "early_stopping": True,
+    "eos_token_id": tokenizer.eos_token_id,
+    "pad_token_id": tokenizer.pad_token_id,
+    "repetition_penalty": 3.0
+}
 input_text += "<SEP>"
 input_text = preprocess(input_text)
     output_ids = model.generate(
         token_ids.to(model.device),
+        **generation_config
     )
 output = tokenizer.decode(output_ids.tolist()[0][token_ids.size(1) :], skip_special_tokens=True)
 output = postprocess(output)