Spaces:

mikeee
/

chatglm2-6b-test

Runtime error

mikeee commited on Jul 14, 2023

Commit

d7ec399

1 Parent(s): 60399ca

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,12 +1,14 @@
 import os
-os.system("pip install --upgrade torch transformers sentencepiece scipy cpm_kernels accelerate bitsandbytes")
 import gradio as gr
 from transformers import AutoTokenizer, AutoModelForCausalLM
-# tokenizer = AutoTokenizer.from_pretrained("THUDM/chatglm2-6b-int4", trust_remote_code=True)
 model = AutoModel.from_pretrained("THUDM/chatglm2-6b-int4", trust_remote_code=True)
 # tokenizer = AutoTokenizer.from_pretrained("openchat/openchat_v2_w")
 # model = AutoModelForCausalLM.from_pretrained("openchat/openchat_v2_w", load_in_8bit_fp32_cpu_offload=True, load_in_8bit=True)
 model.half()

 import os
+os.system("pip install --upgrade torch transformers sentencepiece scipy cpm_kernels accelerate bitsandbytes loguru")
 import gradio as gr
 from transformers import AutoTokenizer, AutoModelForCausalLM
+tokenizer = AutoTokenizer.from_pretrained("THUDM/chatglm2-6b-int4", trust_remote_code=True)
+logger.debug("load")
 model = AutoModel.from_pretrained("THUDM/chatglm2-6b-int4", trust_remote_code=True)
+logger.debug("done load")
 # tokenizer = AutoTokenizer.from_pretrained("openchat/openchat_v2_w")
 # model = AutoModelForCausalLM.from_pretrained("openchat/openchat_v2_w", load_in_8bit_fp32_cpu_offload=True, load_in_8bit=True)
 model.half()