Spaces:

richardr1126
/

sql-skeleton-wizardcoder-demo

Paused

App Files Files Community

richardr1126 commited on Jul 20, 2023

Commit

40c895f

0 Parent(s):

Duplicate from richardr1126/natsql-wizardcoder-demo

Browse files

Files changed (5) hide show

.gitattributes +34 -0
.gitignore +4 -0
README.md +13 -0
app.py +92 -0
requirements.txt +10 -0

.gitattributes ADDED Viewed

	@@ -0,0 +1,34 @@

+*.7z filter=lfs diff=lfs merge=lfs -text
+*.arrow filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.bz2 filter=lfs diff=lfs merge=lfs -text
+*.ckpt filter=lfs diff=lfs merge=lfs -text
+*.ftz filter=lfs diff=lfs merge=lfs -text
+*.gz filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.joblib filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.mlmodel filter=lfs diff=lfs merge=lfs -text
+*.model filter=lfs diff=lfs merge=lfs -text
+*.msgpack filter=lfs diff=lfs merge=lfs -text
+*.npy filter=lfs diff=lfs merge=lfs -text
+*.npz filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.parquet filter=lfs diff=lfs merge=lfs -text
+*.pb filter=lfs diff=lfs merge=lfs -text
+*.pickle filter=lfs diff=lfs merge=lfs -text
+*.pkl filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text
+*.rar filter=lfs diff=lfs merge=lfs -text
+*.safetensors filter=lfs diff=lfs merge=lfs -text
+saved_model/**/* filter=lfs diff=lfs merge=lfs -text
+*.tar.* filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tgz filter=lfs diff=lfs merge=lfs -text
+*.wasm filter=lfs diff=lfs merge=lfs -text
+*.xz filter=lfs diff=lfs merge=lfs -text
+*.zip filter=lfs diff=lfs merge=lfs -text
+*.zst filter=lfs diff=lfs merge=lfs -text
+*tfevents* filter=lfs diff=lfs merge=lfs -text

.gitignore ADDED Viewed

	@@ -0,0 +1,4 @@

+venv/
+.venv/
+env/
+.env/

README.md ADDED Viewed

	@@ -0,0 +1,13 @@

+---
+title: NatSQL WizardCoder Demo
+emoji: 🧙‍♂️
+colorFrom: gray
+colorTo: green
+sdk: gradio
+sdk_version: 3.37.0
+app_file: app.py
+pinned: false
+duplicated_from: richardr1126/natsql-wizardcoder-demo
+---
+Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

app.py ADDED Viewed

	@@ -0,0 +1,92 @@

+import os
+from threading import Event, Thread
+from transformers import (
+    AutoModelForCausalLM,
+    AutoTokenizer,
+    StoppingCriteria,
+    StoppingCriteriaList,
+    TextIteratorStreamer,
+)
+from huggingface_hub import login
+import gradio as gr
+import torch
+login(os.getenv("HF_TOKEN", None))
+model_name = "richardr1126/spider-natsql-wizard-coder-8bit"
+tok = AutoTokenizer.from_pretrained(model_name)
+max_new_tokens = 1536
+print(f"Starting to load the model {model_name}")
+m = AutoModelForCausalLM.from_pretrained(
+    model_name,
+    device_map=0,
+    load_in_8bit=True,
+)
+m.config.pad_token_id = m.config.eos_token_id
+m.generation_config.pad_token_id = m.config.eos_token_id
+stop_tokens = [";", "###", "Result"]
+stop_token_ids = tok.convert_tokens_to_ids(stop_tokens)
+print(f"Successfully loaded the model {model_name} into memory")
+class StopOnTokens(StoppingCriteria):
+    def __call__(self, input_ids: torch.LongTensor, scores: torch.FloatTensor, **kwargs) -> bool:
+        for stop_id in stop_token_ids:
+            if input_ids[0][-1] == stop_id:
+                return True
+        return False
+def bot(input_message: str, temperature=0.1, top_p=0.9, top_k=0, repetition_penalty=1.08):
+    stop = StopOnTokens()
+    messages = input_message
+    input_ids = tok(messages, return_tensors="pt").input_ids
+    input_ids = input_ids.to(m.device)
+    streamer = TextIteratorStreamer(tok, timeout=10.0, skip_prompt=True, skip_special_tokens=True)
+    generate_kwargs = dict(
+        input_ids=input_ids,
+        max_new_tokens=max_new_tokens,
+        temperature=temperature,
+        do_sample=temperature > 0.0,
+        top_p=top_p,
+        top_k=top_k,
+        repetition_penalty=repetition_penalty,
+        streamer=streamer,
+        stopping_criteria=StoppingCriteriaList([stop]),
+    )
+    stream_complete = Event()
+    def generate_and_signal_complete():
+        m.generate(**generate_kwargs)
+        stream_complete.set()
+    t1 = Thread(target=generate_and_signal_complete)
+    t1.start()
+    partial_text = ""
+    for new_text in streamer:
+        partial_text += new_text
+    return partial_text
+gradio_interface = gr.Interface(
+  fn=bot,
+  inputs=[
+      "text",
+      gr.Slider(label="Temperature", minimum=0.0, maximum=1.0, value=0.1, step=0.1),
+      gr.Slider(label="Top-p (nucleus sampling)", minimum=0.0, maximum=1.0, value=0.9, step=0.01),
+      gr.Slider(label="Top-k", minimum=0, maximum=200, value=0, step=1),
+      gr.Slider(label="Repetition Penalty", minimum=1.0, maximum=2.0, value=1.08, step=0.1)
+  ],
+  outputs="text",
+  title="REST API with Gradio and Huggingface Spaces",
+  description="This is a demo of how to build an AI powered REST API with Gradio and Huggingface Spaces – for free! See the **Use via API** link at the bottom of this page.",
+)
+gradio_interface.launch()

requirements.txt ADDED Viewed

	@@ -0,0 +1,10 @@

+einops
+gradio
+torch
+numpy
+sentencepiece
+bitsandbytes
+scipy
+transformers
+accelerate
+huggingface_hub