Spaces:

izumi-lab
/

llama-13b-japanese-lora-v0-1ep

Paused

added

f732d7c over 1 year ago

536 Bytes

	import torch
	from peft import PeftModel
	from transformers import AutoModelForCausalLM
	from transformers import AutoTokenizer

	BASE_MODEL = "decapoda-research/llama-13b-hf"
	LORA_WEIGHTS = "izumi-lab/llama-13b-japanese-lora-v0-1ep"

	tokenizer = AutoTokenizer.from_pretrained(BASE_MODEL)
	model = AutoModelForCausalLM.from_pretrained(
	BASE_MODEL,
	load_in_8bit=False,
	torch_dtype=torch.float16,
	device_map="auto",
	)
	model = PeftModel.from_pretrained(
	model, LORA_WEIGHTS, torch_dtype=torch.float16, use_auth_token=True
	)