Spaces:

Joel-Marin
/

deepseek-8b-test

Running

Joel-Marin commited on Feb 21

Commit

9045974

verified ·

1 Parent(s): 109af35

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,24 +1,17 @@
 import gradio as gr
-import torch
-from transformers import AutoModelForCausalLM, AutoTokenizer, TextGenerationPipeline
-MODEL_NAME = "deepseek-ai/deepseek-llm-7b-chat"  # Change for LLaMA if needed
-# Load model & tokenizer
-tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
-model = AutoModelForCausalLM.from_pretrained(
-    MODEL_NAME,
-    torch_dtype=torch.float16,
-    device_map="auto"  # Uses available GPU/CPU
-)
-# Create text generation pipeline
-pipe = TextGenerationPipeline(model=model, tokenizer=tokenizer)
-# Define Gradio interface
 def chat(prompt):
-    output = pipe(prompt, max_length=512, do_sample=True, temperature=0.7)
-    return output[0]["generated_text"]
-iface = gr.Interface(fn=chat, inputs="text", outputs="text", title="DeepSeek 7B Chatbot")
 iface.launch()

 import gradio as gr
+import requests
+import os
+HF_API_KEY = os.getenv('TOKEN')
+MODEL_NAME = "deepseek-ai/deepseek-llm-7b-chat"
 def chat(prompt):
+    response = requests.post(
+        f"https://api-inference.huggingface.co/models/{MODEL_NAME}",
+        headers={"Authorization": f"Bearer {HF_API_KEY}"},
+        json={"inputs": prompt}
+    )
+    return response.json()[0]["generated_text"]
+iface = gr.Interface(fn=chat, inputs="text", outputs="text", title="DeepSeek API Chatbot")
 iface.launch()