TheBloke_dolphin-2.0-mistral-7B-GGUF_Playground

Runtime error

sam749 commited on Feb 9

Commit

d804f98

•

1 Parent(s): 6a61f1b

Upload folder using huggingface_hub

Files changed (6) hide show

.gitattributes CHANGED Viewed

@@ -33,3 +33,5 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+zephyr-7b-beta.Q4_K_S.gguf filter=lfs diff=lfs merge=lfs -text
+dolphin-2.0-mistral-7b.Q4_K_S.gguf filter=lfs diff=lfs merge=lfs -text

Dockerfile ADDED Viewed

+FROM python:3.9
+WORKDIR /code
+COPY ./requirements.txt /code/requirements.txt
+RUN pip install --no-cache-dir --upgrade -r /code/requirements.txt
+COPY ./dolphin-2.0-mistral-7b.Q4_K_S.gguf /code/dolphin-2.0-mistral-7b.Q4_K_S.gguf
+COPY ./main.py /code/main.py
+CMD ["uvicorn", "main:app", "--host", "0.0.0.0", "--port", "7860"]

README.md CHANGED Viewed

@@ -1,11 +1,11 @@
 ---
-title: TheBloke Dolphin-2.0-mistral-7B-GGUF
-emoji: 📚
-colorFrom: indigo
-colorTo: yellow
 sdk: docker
 pinned: false
-license: apache-2.0
 ---
 Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

 ---
+title: LLM Deployment Zerocost Api
+emoji: 😻
+colorFrom: purple
+colorTo: pink
 sdk: docker
 pinned: false
+license: mit
 ---
 Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

dolphin-2.0-mistral-7b.Q4_K_S.gguf ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:be1991132683eb2207a110a41449239c21dcb3d5a108197e74cba2e006de33eb
+size 4140373664

main.py ADDED Viewed

+from ctransformers import AutoModelForCausalLM
+from fastapi import FastAPI, Form
+from pydantic import BaseModel
+#Model loading
+llm = AutoModelForCausalLM.from_pretrained("dolphin-2.0-mistral-7b.Q4_K_S.gguf",
+model_type='mistral',
+max_new_tokens = 1096,
+threads = 3,
+)
+#Pydantic object
+class validation(BaseModel):
+    prompt: str
+#Fast API
+app = FastAPI()
+#Zephyr completion
+@app.post("/llm_on_cpu")
+async def stream(item: validation):
+    system_prompt = 'Below is an instruction that describes a task. Write a response that appropriately completes the request.'
+    start,end = "<|im_start|>", "<|im_end|>"
+    prompt = f"<|im_start|>system\n{system_prompt}{end}\n{start}user\n{prompt.strip()}{end}\n"
+    return llm(prompt)

requirements.txt ADDED Viewed

+python-multipart
+fastapi
+pydantic
+uvicorn
+requests
+ctransformers