internlm
/

internlm2-base-20b

Text Generation

Model card Files Files and versions Community

x54-729 commited on Jan 17

Commit

70d038d

•

1 Parent(s): a9418b3

fix example prompt

Files changed (1) hide show

README.md +1 -1

README.md CHANGED Viewed

@@ -135,7 +135,7 @@ tokenizer = AutoTokenizer.from_pretrained("internlm/internlm2-base-20b", trust_r
 # `torch_dtype=torch.float16` 可以令模型以 float16 精度加载，否则 transformers 会将模型加载为 float32，有可能导致显存不足
 model = AutoModelForCausalLM.from_pretrained("internlm/internlm2-base-20b", torch_dtype=torch.float16, trust_remote_code=True).cuda()
 model = model.eval()
-inputs = tokenizer(["来到美丽的大自然，我们发现"], return_tensors="pt")
 for k,v in inputs.items():
     inputs[k] = v.cuda()
 gen_kwargs = {"max_length": 128, "top_p": 0.8, "temperature": 0.8, "do_sample": True, "repetition_penalty": 1.0}

 # `torch_dtype=torch.float16` 可以令模型以 float16 精度加载，否则 transformers 会将模型加载为 float32，有可能导致显存不足
 model = AutoModelForCausalLM.from_pretrained("internlm/internlm2-base-20b", torch_dtype=torch.float16, trust_remote_code=True).cuda()
 model = model.eval()
+inputs = tokenizer(["来到美丽的大自然"], return_tensors="pt")
 for k,v in inputs.items():
     inputs[k] = v.cuda()
 gen_kwargs = {"max_length": 128, "top_p": 0.8, "temperature": 0.8, "do_sample": True, "repetition_penalty": 1.0}