WangZeJun
/

bloom-396m-chat

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

WangZeJun commited on May 23, 2023

Commit

6e19446

•

1 Parent(s): 40fdf78

Update README.md

Files changed (1) hide show

README.md +25 -1

README.md CHANGED Viewed

@@ -1,4 +1,28 @@
 ---
 license: bigscience-bloom-rail-1.0
 ---
-https://github.com/zejunwang1/bloom_tuning

 ---
 license: bigscience-bloom-rail-1.0
 ---
+https://github.com/zejunwang1/bloom_tuning
+可以通过如下代码调用 bloom-396m-chat 模型来生成对话：
+```python
+from transformers import BloomTokenizerFast, BloomForCausalLM
+model_name_or_path = "WangZeJun/bloom-396m-chat"
+tokenizer = BloomTokenizerFast.from_pretrained(model_name_or_path)
+model = BloomForCausalLM.from_pretrained(model_name_or_path).cuda()
+model = model.eval()
+input_pattern = "{}</s>"
+text = "你好"
+input_ids = tokenizer(input_pattern.format(text), return_tensors="pt").input_ids
+input_ids = input_ids.cuda()
+outputs = model.generate(input_ids, do_sample=True, max_new_tokens=1024, top_p=0.85,
+    temperature=0.3, repetition_penalty=1.2, eos_token_id=tokenizer.eos_token_id)
+output = tokenizer.decode(outputs[0])
+response = output.replace(text, "").replace('</s>', "")
+print(response)
+```