Spaces:

davanstrien
/

magpie

Running on Zero

App Files Files Community

davanstrien HF staff commited on Jun 14, 2024

Commit

5188e86

verified ·

0 Parent(s):

Super-squash branch 'main' using huggingface_hub

Browse files

Files changed (5) hide show

.gitattributes +35 -0
README.md +12 -0
app.py +90 -0
model_configs.json +55 -0
requirements.txt +3 -0

.gitattributes ADDED Viewed

	@@ -0,0 +1,35 @@

+*.7z filter=lfs diff=lfs merge=lfs -text
+*.arrow filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.bz2 filter=lfs diff=lfs merge=lfs -text
+*.ckpt filter=lfs diff=lfs merge=lfs -text
+*.ftz filter=lfs diff=lfs merge=lfs -text
+*.gz filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.joblib filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.mlmodel filter=lfs diff=lfs merge=lfs -text
+*.model filter=lfs diff=lfs merge=lfs -text
+*.msgpack filter=lfs diff=lfs merge=lfs -text
+*.npy filter=lfs diff=lfs merge=lfs -text
+*.npz filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.parquet filter=lfs diff=lfs merge=lfs -text
+*.pb filter=lfs diff=lfs merge=lfs -text
+*.pickle filter=lfs diff=lfs merge=lfs -text
+*.pkl filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text
+*.rar filter=lfs diff=lfs merge=lfs -text
+*.safetensors filter=lfs diff=lfs merge=lfs -text
+saved_model/**/* filter=lfs diff=lfs merge=lfs -text
+*.tar.* filter=lfs diff=lfs merge=lfs -text
+*.tar filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tgz filter=lfs diff=lfs merge=lfs -text
+*.wasm filter=lfs diff=lfs merge=lfs -text
+*.xz filter=lfs diff=lfs merge=lfs -text
+*.zip filter=lfs diff=lfs merge=lfs -text
+*.zst filter=lfs diff=lfs merge=lfs -text
+*tfevents* filter=lfs diff=lfs merge=lfs -text

README.md ADDED Viewed

	@@ -0,0 +1,12 @@

+---
+title: Magpie
+emoji: 🔥
+colorFrom: red
+colorTo: indigo
+sdk: gradio
+sdk_version: 4.36.1
+app_file: app.py
+pinned: false
+---
+Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

app.py ADDED Viewed

	@@ -0,0 +1,90 @@

+import gradio as gr
+import transformers
+import torch
+import json
+from transformers import AutoTokenizer
+import os
+from huggingface_hub import login
+import spaces
+HF_TOKEN = os.getenv("HF_TOKEN")
+login(HF_TOKEN)
+# Load the model
+model_id = "meta-llama/Meta-Llama-3-8B-Instruct"
+tokenizer = AutoTokenizer.from_pretrained(model_id, add_special_tokens=True)
+pipeline = transformers.pipeline(
+    "text-generation",
+    model=model_id,
+    model_kwargs={"torch_dtype": torch.bfloat16},
+    device="cuda",
+)
+# Load the model configuration
+with open("model_configs.json", "r") as f:
+    model_configs = json.load(f)
+    model_config = model_configs[model_id]
+# Extract instruction
+extract_input = model_config["extract_input"]
+@spaces.GPU
+def generate_instruction_response():
+    terminators = [
+        tokenizer.eos_token_id,
+        tokenizer.convert_tokens_to_ids("<|eot_id|>"),
+    ]
+    instruction = pipeline(
+        extract_input,
+        max_new_tokens=2048,
+        eos_token_id=terminators,
+        do_sample=True,
+        temperature=1,
+        top_p=1,
+    )
+    sanitized_instruction = instruction[0]["generated_text"][
+        len(extract_input) :
+    ].split("\n")[0]
+    response_template = f"""<|begin_of_text|><|start_header_id|>user<|end_header_id|>\n\n{sanitized_instruction}<|eot_id|><|start_header_id|>assistant<|end_header_id|>\n\n"""
+    response = pipeline(
+        response_template,
+        max_new_tokens=2048,
+        eos_token_id=terminators,
+        do_sample=True,
+        temperature=1,
+        top_p=1,
+    )
+    user_message = sanitized_instruction
+    assistant_response = response[0]["generated_text"][len(response_template) :]
+    return user_message, assistant_response
+title = "Magpie demo"
+description = """
+This Gradio demo allows you to explore the approach outlined in the Magpie paper. "Magpie is a data synthesis pipeline that generates high-quality alignment data. Magpie does not rely on prompt engineering or seed questions. Instead, it directly constructs instruction data by prompting aligned LLMs with a pre-query template for sampling instructions." Essentially, instead of prompting the model with a question or a starting query, this approach relies on the pre-query template of the model to generate instructions. Essentially, you are giving the model only the template up to the point where a user instruction would start, and then the model generates the instruction and the response.
+In this demo, you can see how the model generates a user instruction and a model response.
+You can learn more about the approach [in the paper](https://huggingface.co/papers/2406.08464).
+"""
+# Create the Gradio interface
+iface = gr.Interface(
+    fn=generate_instruction_response,
+    inputs=[],
+    outputs=[
+        gr.Text(label="Generated User Instruction"),
+        gr.Text(label="Generated Model Response"),
+    ],
+    title=title,
+    description=description,
+)
+# Launch the app
+iface.launch(debug=True)

model_configs.json ADDED Viewed

	@@ -0,0 +1,55 @@

+{
+  "meta-llama/Meta-Llama-3-8B-Instruct": {
+    "model_name": "meta-llama/Meta-Llama-3-8B-Instruct",
+    "stop_tokens": [
+      "<|eot_id|>",
+      "<|end_of_text|>",
+      "<|starter_header_id|>",
+      "<|end_header_id|>",
+      "assistant"
+    ],
+    "stop_token_ids": [
+      128009,
+      128001,
+      128006,
+      128007,
+      78191
+    ],
+    "extract_input": "<|begin_of_text|><|start_header_id|>user<|end_header_id|>\n\n",
+    "extract_input_with_system_prompt": "<|begin_of_text|><|start_header_id|>system<|end_header_id|>\n\nA chat between a curious user and an artificial intelligence assistant. The assistant gives helpful, detailed, and polite answers to the user's questions.<|eot_id|><|start_header_id|>user<|end_header_id|>\n\n"
+  },
+  "meta-llama/Meta-Llama-3-70B-Instruct": {
+    "model_name": "meta-llama/Meta-Llama-3-70B-Instruct",
+    "stop_tokens": [
+      "<|eot_id|>",
+      "<|end_of_text|>",
+      "<|starter_header_id|>",
+      "<|end_header_id|>",
+      "assistant"
+    ],
+    "stop_token_ids": [
+      128009,
+      128001,
+      128006,
+      128007,
+      78191
+    ],
+    "extract_input": "<|begin_of_text|><|start_header_id|>user<|end_header_id|>\n\n"
+  },
+  "meta-llama/Llama-2-7b-chat-hf": {
+    "model_name": "meta-llama/Llama-2-7b-chat-hf",
+    "stop_tokens": [
+      "</s>",
+      "<s>",
+      "<unk>",
+      "assistant"
+    ],
+    "stop_token_ids": [
+      2,
+      1,
+      0,
+      20255
+    ],
+    "extract_input": "[INST] "
+  }
+}

requirements.txt ADDED Viewed

	@@ -0,0 +1,3 @@

+transformers[torch]
+accelerate
+gradio