Spaces:

Monster
/

Llama-2-7B-chat

Runtime error

Monster commited on Jul 28, 2023

Commit

03153fa

•

1 Parent(s): 6b015ff

rms_norm_eps 1e-5 for best generation quality

Files changed (1) hide show

app.py CHANGED Viewed

@@ -11,7 +11,7 @@ from llama_cpp import LlamaRAMCache
 hf_hub_download(repo_id="TheBloke/Llama-2-7B-chat-GGML", filename="llama-2-7b-chat.ggmlv3.q4_K_M.bin", local_dir=".")
-llm = Llama(model_path="./llama-2-7b-chat.ggmlv3.q4_K_M.bin")
 cache = LlamaRAMCache(capacity_bytes=2 << 30)

 hf_hub_download(repo_id="TheBloke/Llama-2-7B-chat-GGML", filename="llama-2-7b-chat.ggmlv3.q4_K_M.bin", local_dir=".")
+llm = Llama(model_path="./llama-2-7b-chat.ggmlv3.q4_K_M.bin", rms_norm_eps=1e-5)
 cache = LlamaRAMCache(capacity_bytes=2 << 30)