Spaces:

JuanCabs
/

Historical_Languages_LLMs

Runtime error

JuanCabs commited on Oct 5, 2024

Commit

2d751cb

verified ·

1 Parent(s): ec02098

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,10 +1,11 @@
-from transformers import AutoTokenizer, AutoModelForCausalLM
 import torch
 # Cargar el tokenizer del modelo base
 tokenizer = AutoTokenizer.from_pretrained("unsloth/meta-llama-3.1-8b-bnb-4bit")
-# Cargar el modelo base
 model = AutoModelForCausalLM.from_pretrained("unsloth/meta-llama-3.1-8b-bnb-4bit",
                                              load_in_4bit=True,
                                              device_map="auto")
@@ -12,13 +13,18 @@ model = AutoModelForCausalLM.from_pretrained("unsloth/meta-llama-3.1-8b-bnb-4bit
 # Cargar el adaptador LoRA
 model.load_adapter("JuanCabs/lapepav1", source="hf")
-# Prueba de generación de texto
 def generar_respuesta(prompt):
     inputs = tokenizer(prompt, return_tensors="pt").to("cuda")
     outputs = model.generate(**inputs, max_length=100)
     return tokenizer.decode(outputs[0], skip_special_tokens=True)
-# Ejemplo de uso
-prompt = "¿Cómo será el futuro de la inteligencia artificial?"
-respuesta = generar_respuesta(prompt)
-print(respuesta)

+import gradio as gr
+from transformers import AutoModelForCausalLM, AutoTokenizer
 import torch
 # Cargar el tokenizer del modelo base
 tokenizer = AutoTokenizer.from_pretrained("unsloth/meta-llama-3.1-8b-bnb-4bit")
+# Cargar el modelo base con soporte de 4 bits
 model = AutoModelForCausalLM.from_pretrained("unsloth/meta-llama-3.1-8b-bnb-4bit",
                                              load_in_4bit=True,
                                              device_map="auto")
 # Cargar el adaptador LoRA
 model.load_adapter("JuanCabs/lapepav1", source="hf")
+# Función para generar texto con el modelo
 def generar_respuesta(prompt):
     inputs = tokenizer(prompt, return_tensors="pt").to("cuda")
     outputs = model.generate(**inputs, max_length=100)
     return tokenizer.decode(outputs[0], skip_special_tokens=True)
+# Crear la interfaz de Gradio
+interface = gr.Interface(fn=generar_respuesta, inputs="text", outputs="text",
+                         title="Generación de Texto con Lora y Llama 3.1",
+                         description="Introduce un texto y genera una respuesta usando un modelo con LoRA.")
+# Lanzar la aplicación en Hugging Face Spaces
+if __name__ == "__main__":
+    interface.launch()