StableBeluga-7B-Chat

Running on T4

App Files Files Community

abidlabs HF staff

Sentdex commited on Aug 11, 2023

Commit

de87148

•

0 Parent(s):

Duplicate from Sentdex/StableBeluga-7B-Chat

Browse files

Co-authored-by: Harrison Kinsley <Sentdex@users.noreply.huggingface.co>

Files changed (4) hide show

.gitattributes +35 -0
README.md +14 -0
app.py +86 -0
requirements.txt +8 -0

.gitattributes ADDED Viewed

	@@ -0,0 +1,35 @@

+*.7z filter=lfs diff=lfs merge=lfs -text
+*.arrow filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.bz2 filter=lfs diff=lfs merge=lfs -text
+*.ckpt filter=lfs diff=lfs merge=lfs -text
+*.ftz filter=lfs diff=lfs merge=lfs -text
+*.gz filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.joblib filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.mlmodel filter=lfs diff=lfs merge=lfs -text
+*.model filter=lfs diff=lfs merge=lfs -text
+*.msgpack filter=lfs diff=lfs merge=lfs -text
+*.npy filter=lfs diff=lfs merge=lfs -text
+*.npz filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.parquet filter=lfs diff=lfs merge=lfs -text
+*.pb filter=lfs diff=lfs merge=lfs -text
+*.pickle filter=lfs diff=lfs merge=lfs -text
+*.pkl filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text
+*.rar filter=lfs diff=lfs merge=lfs -text
+*.safetensors filter=lfs diff=lfs merge=lfs -text
+saved_model/**/* filter=lfs diff=lfs merge=lfs -text
+*.tar.* filter=lfs diff=lfs merge=lfs -text
+*.tar filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tgz filter=lfs diff=lfs merge=lfs -text
+*.wasm filter=lfs diff=lfs merge=lfs -text
+*.xz filter=lfs diff=lfs merge=lfs -text
+*.zip filter=lfs diff=lfs merge=lfs -text
+*.zst filter=lfs diff=lfs merge=lfs -text
+*tfevents* filter=lfs diff=lfs merge=lfs -text

README.md ADDED Viewed

	@@ -0,0 +1,14 @@

+---
+title: StableBeluga 7B Chat
+emoji: 🦀
+colorFrom: pink
+colorTo: yellow
+sdk: gradio
+sdk_version: 3.39.0
+app_file: app.py
+pinned: false
+license: apache-2.0
+duplicated_from: Sentdex/StableBeluga-7B-Chat
+---
+Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

app.py ADDED Viewed

	@@ -0,0 +1,86 @@

+import gradio as gr
+import transformers
+from torch import bfloat16
+# from dotenv import load_dotenv  # if you wanted to adapt this for a repo that uses auth
+from threading import Thread
+#HF_AUTH = os.getenv('HF_AUTH')
+model_id = "stabilityai/StableBeluga-7B"
+bnb_config = transformers.BitsAndBytesConfig(
+    load_in_4bit=True,
+    bnb_4bit_quant_type='nf4',
+    bnb_4bit_use_double_quant=True,
+    bnb_4bit_compute_dtype=bfloat16
+)
+model_config = transformers.AutoConfig.from_pretrained(
+    model_id,
+    #use_auth_token=HF_AUTH
+)
+model = transformers.AutoModelForCausalLM.from_pretrained(
+    model_id,
+    trust_remote_code=True,
+    config=model_config,
+    quantization_config=bnb_config,
+    device_map='auto',
+    #use_auth_token=HF_AUTH
+)
+tokenizer = transformers.AutoTokenizer.from_pretrained(
+    model_id,
+    #use_auth_token=HF_AUTH
+)
+DESCRIPTION = """
+# Stable Beluga 7B Chat
+This is a streaming Chat Interface implementation of [StableBeluga-7B](https://huggingface.co/stabilityai/StableBeluga-7B)
+You can modify the system prompt, which can be quite fun. For example, you can try something like "You are a mean AI. Phrase all replies as insults" for a good laugh.
+Sometimes the model doesn't appropriately hit its stop token. Feel free to hit "stop" and "retry" if this happens to you. Or PR a fix to stop the stream if the tokens for User: get hit or something.
+"""
+def prompt_build(system_prompt, user_inp, hist):
+    prompt = f"""### System:\n{system_prompt}\n\n"""
+    for pair in hist:
+        prompt += f"""### User:\n{pair[0]}\n\n### Assistant:\n{pair[1]}\n\n"""
+    prompt += f"""### User:\n{user_inp}\n\n### Assistant:"""
+    return prompt
+def chat(user_input, history, system_prompt):
+    prompt = prompt_build(system_prompt, user_input, history)
+    model_inputs = tokenizer([prompt], return_tensors="pt").to("cuda")
+    streamer = transformers.TextIteratorStreamer(tokenizer, timeout=10., skip_prompt=True, skip_special_tokens=True)
+    generate_kwargs = dict(
+        model_inputs,
+        streamer=streamer,
+        max_new_tokens=2048,
+        do_sample=True,
+        top_p=0.95,
+        temperature=0.8,
+        top_k=50
+    )
+    t = Thread(target=model.generate, kwargs=generate_kwargs)
+    t.start()
+    model_output = ""
+    for new_text in streamer:
+        model_output += new_text
+        yield model_output
+    return model_output
+with gr.Blocks() as demo:
+    gr.Markdown(DESCRIPTION)
+    system_prompt = gr.Textbox("You are helpful AI.", label="System Prompt")
+    chatbot = gr.ChatInterface(fn=chat, additional_inputs=[system_prompt])
+demo.queue().launch()

requirements.txt ADDED Viewed

	@@ -0,0 +1,8 @@

+transformers
+gradio
+torch
+bitsandbytes
+einops
+accelerate
+xformers
+scipy