Spaces:

CarperAI
/

StableVicuna

Paused

jon-tow commited on Apr 26, 2023

Commit

ab740b3

1 Parent(s): 3708810

fix: load 8-bit model

Files changed (2) hide show

app.py CHANGED Viewed

@@ -13,16 +13,14 @@ tokenizer = AutoTokenizer.from_pretrained(
     use_auth_token=auth_token if auth_token else True,
 )
 model = AutoModelForCausalLM.from_pretrained(
-    "CarperAI/vicuna-13b-fine-tuned-rlhf-fp16",
-    torch_dtype=torch.float16,
-    device_map="auto",
-    offload_folder="./offload",
-    low_cpu_mem_usage=True,  # Not required for demo but leave for now
     use_auth_token=auth_token if auth_token else True,
 )
 model.cuda()
 max_context_length = model.config.max_position_embeddings
-max_new_tokens = 500
 prompt_template = Template("""\

     use_auth_token=auth_token if auth_token else True,
 )
 model = AutoModelForCausalLM.from_pretrained(
+    "CarperAI/vicuna-13b-fine-tuned-rlhf-8bit",
     use_auth_token=auth_token if auth_token else True,
 )
 model.cuda()
 max_context_length = model.config.max_position_embeddings
+max_new_tokens = 512
 prompt_template = Template("""\

requirements.txt CHANGED Viewed

@@ -1,3 +1,4 @@
 accelerate
 torch
 transformers>=4.28.0,<4.29.0

 accelerate
 torch
+bitsandbytes
 transformers>=4.28.0,<4.29.0