wizardcoder-ggml

Build error

App Files Files Community

vasilee

matthoffner commited on Jun 15, 2023

Commit

d53389b

0 Parent(s):

Duplicate from matthoffner/wizardcoder-ggml

Browse files

Co-authored-by: Matt Hoffner <matthoffner@users.noreply.huggingface.co>

Files changed (5) hide show

.gitattributes +34 -0
Dockerfile +23 -0
README.md +19 -0
main.py +56 -0
requirements.txt +11 -0

.gitattributes ADDED Viewed

	@@ -0,0 +1,34 @@

+*.7z filter=lfs diff=lfs merge=lfs -text
+*.arrow filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.bz2 filter=lfs diff=lfs merge=lfs -text
+*.ckpt filter=lfs diff=lfs merge=lfs -text
+*.ftz filter=lfs diff=lfs merge=lfs -text
+*.gz filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.joblib filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.mlmodel filter=lfs diff=lfs merge=lfs -text
+*.model filter=lfs diff=lfs merge=lfs -text
+*.msgpack filter=lfs diff=lfs merge=lfs -text
+*.npy filter=lfs diff=lfs merge=lfs -text
+*.npz filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.parquet filter=lfs diff=lfs merge=lfs -text
+*.pb filter=lfs diff=lfs merge=lfs -text
+*.pickle filter=lfs diff=lfs merge=lfs -text
+*.pkl filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text
+*.rar filter=lfs diff=lfs merge=lfs -text
+*.safetensors filter=lfs diff=lfs merge=lfs -text
+saved_model/**/* filter=lfs diff=lfs merge=lfs -text
+*.tar.* filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tgz filter=lfs diff=lfs merge=lfs -text
+*.wasm filter=lfs diff=lfs merge=lfs -text
+*.xz filter=lfs diff=lfs merge=lfs -text
+*.zip filter=lfs diff=lfs merge=lfs -text
+*.zst filter=lfs diff=lfs merge=lfs -text
+*tfevents* filter=lfs diff=lfs merge=lfs -text

Dockerfile ADDED Viewed

	@@ -0,0 +1,23 @@

+FROM python:latest
+ENV PYTHONUNBUFFERED 1
+EXPOSE 8000
+RUN useradd -m -u 1000 user
+USER user
+ENV HOME=/home/user \
+	PATH=/home/user/.local/bin:$PATH
+WORKDIR $HOME/app
+COPY requirements.txt ./
+RUN pip install --upgrade pip && \
+    pip install -r requirements.txt
+COPY --chown=user . $HOME/app
+RUN ls -al
+CMD ["uvicorn", "main:app", "--host", "0.0.0.0", "--port", "8000"]

README.md ADDED Viewed

	@@ -0,0 +1,19 @@

+---
+title: wizardcoder
+emoji: 🧙‍♂️💻🛫
+sdk: docker
+app_port: 8000
+duplicated_from: matthoffner/wizardcoder-ggml
+---
+# WizardCoder-ggml
+## <a href="https://github.com/ggerganov/ggml" target="_blank">ggml</a>
+## <a href="https://github.com/marella/ctransformers" target="_blank">ctransformers</a>
+## [FastAPI Docs](https://matthoffner-wizardcoder-ggml.hf.space/docs)
+### Updates
+* Added /v1/chat/completions
+* [Start using ctransformers](https://github.com/marella/ctransformers)
+* [Added starcoder example](https://github.com/ggerganov/ggml/tree/master/examples/starcoder)

main.py ADDED Viewed

	@@ -0,0 +1,56 @@

+import fastapi
+import json
+import markdown
+import uvicorn
+from fastapi.responses import HTMLResponse
+from fastapi.middleware.cors import CORSMiddleware
+from sse_starlette.sse import EventSourceResponse
+from ctransformers import AutoModelForCausalLM
+from pydantic import BaseModel
+llm = AutoModelForCausalLM.from_pretrained("TheBloke/WizardCoder-15B-1.0-GGML",
+                                           model_file="WizardCoder-15B-1.0.ggmlv3.q4_0.bin",
+                                           model_type="starcoder")
+app = fastapi.FastAPI(title="WizardCoder")
+app.add_middleware(
+    CORSMiddleware,
+    allow_origins=["*"],
+    allow_credentials=True,
+    allow_methods=["*"],
+    allow_headers=["*"],
+)
+@app.get("/")
+async def index():
+    html_content = """
+    <html>
+        <head>
+        </head>
+        <body>
+            <h1><a href="https://matthoffner-wizardcoder-ggml.hf.space/docs">FastAPI Docs</a></h1>
+            <iframe
+                src="https://matthoffner-monacopilot.hf.space"
+                frameborder="0"
+                width="850"
+                height="450"
+            ></iframe>
+        </body>
+    </html>
+    """
+    return HTMLResponse(content=html_content, status_code=200)
+class ChatCompletionRequest(BaseModel):
+    prompt: str
+@app.post("/v1/chat/completions")
+async def chat(request: ChatCompletionRequest, response_mode=None):
+    tokens = llm.tokenize(request.prompt)
+    async def server_sent_events(chat_chunks, llm):
+        for chat_chunk in llm.generate(chat_chunks):
+            yield dict(data=json.dumps(llm.detokenize(chat_chunk)))
+        yield dict(data="[DONE]")
+    return EventSourceResponse(server_sent_events(tokens, llm))
+if __name__ == "__main__":
+  uvicorn.run(app, host="0.0.0.0", port=8000)

requirements.txt ADDED Viewed

	@@ -0,0 +1,11 @@

+uvicorn
+markdown
+fastapi
+loguru
+torch
+numpy
+transformers
+ctransformers
+accelerate
+langchain
+sse_starlette