Spaces:

gpcerv
/

llama

Runtime error

llama / app.py

Update app.py

ca8f36a 11 months ago

709 Bytes

	from transformers import AutoTokenizer
	import transformers
	import torch

	model = "meta-llama/Llama-2-7b-chat-hf"

	tokenizer = AutoTokenizer.from_pretrained(model)
	pipeline = transformers.pipeline(
	"text-generation",
	model=model,
	torch_dtype=torch.float16,
	device_map="auto",
	use_auth_token=os.environ.get('api'),
	)

	sequences = pipeline(
	'I liked "Breaking Bad" and "Band of Brothers". Do you have any recommendations of other shows I might like?\n',
	do_sample=True,
	top_k=10,
	num_return_sequences=1,
	eos_token_id=tokenizer.eos_token_id,
	max_length=200,
	use_auth_token=os.environ.get('api'),
	)
	for seq in sequences:
	print(f"Result: {seq['generated_text']}")