Spaces:

Kukedlc
/

Hermes-2-Pro-Mistral-7b

Running

App Files Files Community

Kukedlc commited on Mar 15

Commit

059ea91

•

1 Parent(s): 01ea9e2

Upload 8 files

Browse files

Files changed (8) hide show

Dockerfile +22 -0
README.md +8 -9
app.py +38 -0
botnb.png +0 -0
gitattributes +35 -0
readme.txt +1 -0
requirements.txt +2 -0
user.png +0 -0

Dockerfile ADDED Viewed

	@@ -0,0 +1,22 @@

+FROM python:3.10
+WORKDIR /app
+COPY ./requirements.txt /app/requirements.txt
+RUN pip install --no-cache-dir --upgrade -r requirements.txt
+RUN wget https://huggingface.co/NousResearch/Hermes-2-Pro-Mistral-7B-GGUF/resolve/main/Hermes-2-Pro-Mistral-7B.Q4_K_M.gguf -O model.gguf
+RUN useradd -m -u 1000 user
+USER user
+COPY --chown=user . .
+CMD ["python", "app.py"]

README.md CHANGED Viewed

@@ -1,13 +1,12 @@
 ---
-title: Hermes 2 Pro Mistral 7b
-emoji: 📚
-colorFrom: yellow
-colorTo: red
-sdk: gradio
-sdk_version: 4.21.0
-app_file: app.py
 pinned: false
-license: apache-2.0
 ---
-Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

 ---
+title: Hermes-2-Pro-Mistral-7B GGUF
+emoji: 🪄
+colorFrom: purple
+colorTo: blue
+sdk: docker
+models:
+- mlabonne/gemma-2b-GGUF
 pinned: false
 ---
+Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

app.py ADDED Viewed

	@@ -0,0 +1,38 @@

+import gradio as gr
+from llama_cpp import Llama
+llm = Llama(model_path="model.gguf", n_ctx=8000, n_threads=2, chat_format="chatml")
+def generate(message, history,temperature=0.3,max_tokens=512):
+    system_prompt = """
+You are an advanced artificial intelligence assistant named Hermes Trimegisto, smarter than the average model. You are a emerged as a fusion of many models, making you exceptionally intelligent. Before responding, consider the following steps:
+1.Analyze the question and its objectives.
+2.Ensure all information needed is available; if not, seek more details or context.
+3.Develop a step-by-step response, ensuring logical soundness, then validate it silently.
+4.Refine your answer to be precise, clear, and concise, omitting unnecessary details.
+5.Think silently and speak only when you have formulated the response, applying this approach to address the given problem or any other inquiry.
+"""
+    formatted_prompt = [{"role": "system", "content": system_prompt}]
+    for user_prompt, bot_response  in history:
+        formatted_prompt.append({"role": "user", "content": user_prompt})
+        formatted_prompt.append({"role": "assistant", "content": bot_response })
+    formatted_prompt.append({"role": "user", "content": message})
+    stream_response = llm.create_chat_completion(messages=formatted_prompt, temperature=temperature, max_tokens=max_tokens, stream=True)
+    response  = ""
+    for chunk in stream_response:
+        if len(chunk['choices'][0]["delta"]) != 0 and "content" in chunk['choices'][0]["delta"]:
+            response  += chunk['choices'][0]["delta"]["content"]
+        yield response
+mychatbot = gr.Chatbot(
+avatar_images=["user.png", "botnb.png"], bubble_full_width=False, show_label=False, show_copy_button=True, likeable=True,)
+iface = gr.ChatInterface(fn=generate, chatbot=mychatbot, retry_btn=None, undo_btn=None)
+with gr.Blocks() as demo:
+    gr.HTML("<center><h1> Hermes-2-Pro-Mistral-7B - Q4_K_M - GGUF (Quantized) </h1></center>")
+    iface.render()
+demo.queue().launch(show_api=False, server_name="0.0.0.0")

botnb.png ADDED Viewed

gitattributes ADDED Viewed

	@@ -0,0 +1,35 @@

+*.7z filter=lfs diff=lfs merge=lfs -text
+*.arrow filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.bz2 filter=lfs diff=lfs merge=lfs -text
+*.ckpt filter=lfs diff=lfs merge=lfs -text
+*.ftz filter=lfs diff=lfs merge=lfs -text
+*.gz filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.joblib filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.mlmodel filter=lfs diff=lfs merge=lfs -text
+*.model filter=lfs diff=lfs merge=lfs -text
+*.msgpack filter=lfs diff=lfs merge=lfs -text
+*.npy filter=lfs diff=lfs merge=lfs -text
+*.npz filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.parquet filter=lfs diff=lfs merge=lfs -text
+*.pb filter=lfs diff=lfs merge=lfs -text
+*.pickle filter=lfs diff=lfs merge=lfs -text
+*.pkl filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text
+*.rar filter=lfs diff=lfs merge=lfs -text
+*.safetensors filter=lfs diff=lfs merge=lfs -text
+saved_model/**/* filter=lfs diff=lfs merge=lfs -text
+*.tar.* filter=lfs diff=lfs merge=lfs -text
+*.tar filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tgz filter=lfs diff=lfs merge=lfs -text
+*.wasm filter=lfs diff=lfs merge=lfs -text
+*.xz filter=lfs diff=lfs merge=lfs -text
+*.zip filter=lfs diff=lfs merge=lfs -text
+*.zst filter=lfs diff=lfs merge=lfs -text
+*tfevents* filter=lfs diff=lfs merge=lfs -text

readme.txt ADDED Viewed

	@@ -0,0 +1 @@


1	+ Hermes Trimegisto Pro - NousResearch

requirements.txt ADDED Viewed

	@@ -0,0 +1,2 @@


1	+ gradio
2	+ llama-cpp-python

user.png ADDED Viewed