OpenNLPLab
/

TransNormerLLM2-7B-300B

Text Generation

Model card Files Files and versions Community

OpenNLPLab commited on Jan 11, 2024

Commit

98b2957

·

verified ·

1 Parent(s): a5df324

Add bf16

Files changed (1) hide show

README.md +2 -2

README.md CHANGED Viewed

@@ -112,12 +112,12 @@ export use_triton=False
 ```python
 >>> from transformers import AutoModelForCausalLM, AutoTokenizer
 >>> tokenizer = AutoTokenizer.from_pretrained("OpenNLPLab/TransNormerLLM2-7B-300B", trust_remote_code=True)
->>> model = AutoModelForCausalLM.from_pretrained("TransNormerLLM2-7B-300B", device_map="auto", trust_remote_code=True)
 >>> inputs = tokenizer('今天是美好的一天', return_tensors='pt')
 >>> pred = model.generate(**inputs, max_new_tokens=8192, repetition_penalty=1.0)
 >>> print(tokenizer.decode(pred.cpu()[0], skip_special_tokens=True))
 ```
 # Fine-tuning the Model

 ```python
 >>> from transformers import AutoModelForCausalLM, AutoTokenizer
 >>> tokenizer = AutoTokenizer.from_pretrained("OpenNLPLab/TransNormerLLM2-7B-300B", trust_remote_code=True)
+>>> model = AutoModelForCausalLM.from_pretrained("TransNormerLLM2-7B-300B", torch_dtype=torch.bfloat16, device_map="auto", trust_remote_code=True)
 >>> inputs = tokenizer('今天是美好的一天', return_tensors='pt')
 >>> pred = model.generate(**inputs, max_new_tokens=8192, repetition_penalty=1.0)
 >>> print(tokenizer.decode(pred.cpu()[0], skip_special_tokens=True))
 ```
+* **Note**: we recommend to use `bfloat16` in `TransNormerLLM`, `float16` might lead `nan` error, please check your divce compatibility!
 # Fine-tuning the Model