EC2

Sleeping

Cran-May commited on Nov 4, 2023

Commit

672937e

1 Parent(s): 76a55b0

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -7,6 +7,9 @@ import requests
 import time
 import sys
 from huggingface_hub import snapshot_download
 from llama_cpp import Llama
@@ -42,8 +45,8 @@ def get_system_tokens(model):
     return get_message_tokens(model, **system_message)
-repo_name = "TheBloke/stable-vicuna-13B-GGUF"
-model_name = "stable-vicuna-13B.Q4_K_S.gguf"
 snapshot_download(repo_id=repo_name, local_dir=".", allow_patterns=model_name)
@@ -104,7 +107,7 @@ with gr.Blocks(
 ) as demo:
     gr.Markdown(f"""<h1><center>JWorld-Cecilia-人工智能助理</center></h1>""")
     gr.Markdown(value="""这儿是一个中文模型的部署。
-        这是量化版 Cecilia 的部署，具有 130亿 个参数，在 CPU 上运行。
         Cecilia 是一种会话语言模型，在多种类型的语料库上进行训练。
         本节目由上海师范大学附属外国语中学 & JWorld NLPark 赞助播出""")

 import time
 import sys
+os.system("pip install --upgrade pip")
+os.system('''CMAKE_ARGS="-DLLAMA_AVX512=ON -DLLAMA_AVX512_VBMI=ON -DLLAMA_AVX512_VNNI=ON -DLLAMA_FP16_VA=ON -DLLAMA_WASM_SIMD=ON" pip install llama-cpp-python''')
 from huggingface_hub import snapshot_download
 from llama_cpp import Llama
     return get_message_tokens(model, **system_message)
+repo_name = "maddes8cht/mosaicml-mpt-30b-chat-gguf"
+model_name = "mosaicml-mpt-30b-chat-Q4_K_S.gguf"
 snapshot_download(repo_id=repo_name, local_dir=".", allow_patterns=model_name)
 ) as demo:
     gr.Markdown(f"""<h1><center>JWorld-Cecilia-人工智能助理</center></h1>""")
     gr.Markdown(value="""这儿是一个中文模型的部署。
+        这是量化版 Cecilia 的部署，具有 300亿 个参数，在 CPU 上运行。
         Cecilia 是一种会话语言模型，在多种类型的语料库上进行训练。
         本节目由上海师范大学附属外国语中学 & JWorld NLPark 赞助播出""")