Ubuntu

Use hub model for inference

8d4df10 8 months ago

No virus

600 Bytes

	from transformers import AutoTokenizer
	import transformers
	import torch

	model = "juliensimon/llama2-7b-qlora-openassistant-guanaco"

	tokenizer = AutoTokenizer.from_pretrained(model)
	pipeline = transformers.pipeline(
	"text-generation",
	model=model,
	device_map="auto",
	)

	sequences = pipeline(
	'I liked "Breaking Bad" and "Band of Brothers". Please recommend 3 other shows I might like.\n',
	do_sample=True,
	top_k=10,
	num_return_sequences=1,
	eos_token_id=tokenizer.eos_token_id,
	max_length=200,
	)
	for seq in sequences:
	print(f"Result: {seq['generated_text']}")