jetaudio
/

rwkv-5-v2-3b-16k

Text Generation

Inference Endpoints

Model card Files Files and versions Community

rwkv-5-v2-3b-16k / README.md

jetaudio's picture

Update README.md

7089940 verified 8 months ago

|

history blame contribute delete

No virus

1.15 kB

	#### GPU
	```python
	import torch
	from transformers import AutoModelForCausalLM, AutoTokenizer

	def generate_prompt(instruction, input=""):
	instruction = instruction.strip().replace('\r\n','\n').replace('\n\n','\n')
	input = input.strip().replace('\r\n','\n').replace('\n\n','\n')
	if input:
	return f"""Instruction: {instruction}

	Input: {input}

	Response:"""
	else:
	return f"""User: hi

	Assistant: Hi. I am your assistant and I will provide expert full response in full details. Please feel free to ask any question and I will always answer it.

	User: {instruction}

	Assistant:"""


	model = AutoModelForCausalLM.from_pretrained("jetaudio/rwkv-5-v2-3b-16k", trust_remote_code=True, torch_dtype=torch.bfloat16).to(0)
	tokenizer = AutoTokenizer.from_pretrained("jetaudio/rwkv-5-v2-3b-16k", trust_remote_code=True)

	text = "介绍一下大熊猫"
	prompt = generate_prompt(text)

	inputs = tokenizer(prompt, return_tensors="pt").to(0)
	output = model.generate(inputs["input_ids"], max_new_tokens=128, do_sample=True, temperature=1.0, top_p=0.3, top_k=0, )
	print(tokenizer.decode(output[0].tolist(), skip_special_tokens=True))
	```