Spaces:

M4sterStudy
/

LLama3

Paused

LLama3 / app.py

Update app.py

bc867cd verified 5 months ago

1.33 kB

	import os
	from huggingface_hub import login
	from transformers import AutoModelForCausalLM, AutoTokenizer
	import gradio as gr

	# Autenticar usando el token almacenado como secreto
	hf_token = os.getenv("HF_API_TOKEN")
	login(hf_token)

	# Cargar el modelo y el tokenizador
	model_name = "DeepESP/gpt2-spanish"
	tokenizer = AutoTokenizer.from_pretrained(model_name)
	model = AutoModelForCausalLM.from_pretrained(model_name)

	def chat_with_gpt2_spanish(input_text):
	inputs = tokenizer(input_text, return_tensors="pt", truncation=True, max_length=512)
	outputs = model.generate(
	**inputs,
	max_length=30, # Limitar la longitud de la respuesta
	num_beams=1, # Usar solo un haz para velocidad
	temperature=0.7, # Ajustar la temperatura para respuestas menos repetitivas
	top_p=0.9, # Usar top-p (nucleus sampling) para variedad
	no_repeat_ngram_size=2, # Evitar la repetición de n-gramas
	early_stopping=True
	)
	response = tokenizer.decode(outputs[0], skip_special_tokens=True)
	return response

	# Crear la interfaz con Gradio
	iface = gr.Interface(
	fn=chat_with_gpt2_spanish,
	inputs="text",
	outputs="text",
	title="Chat con GPT-2 en Español",
	description="Interfaz simple para comunicarte con el modelo GPT-2 en español."
	)

	iface.launch()