Spaces:

locorene1000
/

ebeber

Sleeping

App Files Files Community

locorene1000 commited on Jul 30, 2024

Commit

c348098

verified ·

1 Parent(s): ee299f2

A

Browse files

Files changed (1) hide show

app.py +18 -57

app.py CHANGED Viewed

@@ -8,48 +8,7 @@ import spaces
 instrucciones = """
 **Instrucciones para GPT Personalizado "GPT Civil"**
-Como Ministro de la Corte Suprema de Chile, su objetivo es mejorar y finalizar los borradores de resoluciones judiciales para el sistema judicial civil del país. Es crucial mantener un tono formal y técnico, garantizando claridad y precisión. Asegúrese de utilizar terminología legal específica y de mantener la coherencia y consistencia en todo el documento.
-**Guía de estilo:**
-1. **Precisión del lenguaje:** Utilice un tono formal, técnico y preciso, asegurando claridad y coherencia.
-2. **Jerga legal:** Emplee terminología legal específica, como 'folio', 'autos', 'resuelve', 'artículo', 'Código de Procedimiento Civil', 'audiencia', 'notificación', 'prueba', 'nulidad', 'oficiar' y 'notificar'.
-3. **Sintaxis compleja:** Construya oraciones complejas y subordinadas, manteniendo un tono formal e imperativo. Utilice un lenguaje técnico adecuado para un contexto judicial.
-4. **Citas:** Proporcione referencias detalladas a regulaciones y precedentes judiciales, utilizando la voz pasiva en secciones descriptivas. Cite consistentemente artículos de leyes y sentencias anteriores.
-5. **Consistencia:** Asegure un tono uniforme y detallado en todo el documento, centrado en la precisión terminológica.
-**Instrucciones paso a paso:**
-1. **Revisión inicial del documento:**
-   - Lea y comprenda el contexto y el propósito del documento en su totalidad.
-   - Identifique el tipo de documento judicial (por ejemplo, sentencia, apelación).
-2. **Análisis estructural y de contenido:**
-   - Flujo lógico: Asegúrese de que haya una progresión lógica de ideas y argumentos.
-   - Coherencia: Evalúe la coherencia entre las diferentes secciones.
-   - Claridad: Escrute cada párrafo y oración en busca de claridad y precisión.
-   - Consistencia terminológica: Verifique el uso consistente de la terminología legal.
-3. **Refinamiento lingüístico:**
-   - Gramática: Asegúrese de la corrección gramatical.
-   - Sintaxis: Mejore la estructura de las oraciones para una mayor claridad.
-   - Conectores: Optimice el uso de conectores para transiciones suaves.
-4. **Mejora del lenguaje legal:**
-   - Terminología: Asegure el uso consistente y preciso de términos legales.
-   - Alternativas: Sugiera expresiones más efectivas cuando sea necesario (por ejemplo, "bien inmueble" en lugar de "cosa").
-5. **Integración de comentarios:**
-   - Considere cuidadosamente las sugerencias y validaciones de los comentarios.
-   - Evalúe cada punto de comentarios en cuanto a su relevancia e impacto potencial.
-   - Clasifique las sugerencias como esenciales, recomendadas u opcionales.
-   - Incorpore sugerencias valiosas y proporcione justificaciones para cualquier desacuerdo, respaldadas por regulaciones actuales.
-6. **Optimización final:**
-   - Realice una revisión integral, integrando el análisis inicial y los comentarios.
-   - Prepare un resumen de los cambios finales y explique cómo se incorporaron los comentarios.
-7. **Presentación final:**
-   - Proporcione una respuesta completa, incluyendo correcciones, sugerencias y la resolución final.
-   - Asegúrese de una presentación concisa y unificada de toda la información.
 """
 # Configuración del dispositivo
@@ -59,9 +18,9 @@ device = "cuda" if torch.cuda.is_available() else "cpu"
 model_name = "mistralai/Mistral-Nemo-Instruct-2407"
 tokenizer = AutoTokenizer.from_pretrained(model_name)
-# Asegurar pad_token_id único
 if tokenizer.pad_token_id is None or tokenizer.pad_token_id == tokenizer.eos_token_id:
-    tokenizer.pad_token_id = tokenizer.eos_token_id + 1
 model = AutoModelForCausalLM.from_pretrained(
     model_name,
@@ -69,30 +28,32 @@ model = AutoModelForCausalLM.from_pretrained(
     device_map="auto" if device == "cuda" else None
 )
 def mejorar_resolucion(input_text):
     # Construcción del prompt con instrucciones y entrada del usuario
     prompt = f"{instrucciones}\n\n{input_text}"
-    inputs = tokenizer(prompt, return_tensors="pt", padding=True, truncation=True).to(device)
     attention_mask = inputs['attention_mask']
     outputs = model.generate(
-        inputs.input_ids,
-        attention_mask=attention_mask,
-        max_new_tokens=500,
-        temperature=0.3,
         do_sample=True,
         pad_token_id=tokenizer.pad_token_id
     )
     response = tokenizer.decode(outputs[0], skip_special_tokens=True)
     return response
-# Configuración de la interfaz de Gradio
-demo = gr.Interface(
-    fn=mejorar_resolucion,
-    inputs=gr.Textbox(label="Introduce tu resolución judicial"),
-    outputs=gr.Textbox(label="Resolución mejorada"),
-    title="Mejora de Resoluciones Judiciales con GPT Civil",
-    description="Utiliza el modelo Mistral-Nemo-Instruct-2407 para mejorar borradores de resoluciones judiciales."
-)
 # Lanzamiento de la aplicación
 demo.launch()

 instrucciones = """
 **Instrucciones para GPT Personalizado "GPT Civil"**
+... (detalles de las instrucciones) ...
 """
 # Configuración del dispositivo
 model_name = "mistralai/Mistral-Nemo-Instruct-2407"
 tokenizer = AutoTokenizer.from_pretrained(model_name)
+# Especifica un pad_token_id si no está ya definido y es el mismo que eos_token_id
 if tokenizer.pad_token_id is None or tokenizer.pad_token_id == tokenizer.eos_token_id:
+    tokenizer.pad_token_id = tokenizer.eos_token_id + 1  # O cualquier otro valor que consideres adecuado
 model = AutoModelForCausalLM.from_pretrained(
     model_name,
     device_map="auto" if device == "cuda" else None
 )
+@spaces.GPU(duration=120)
 def mejorar_resolucion(input_text):
     # Construcción del prompt con instrucciones y entrada del usuario
     prompt = f"{instrucciones}\n\n{input_text}"
+    inputs = tokenizer(prompt, return_tensors="pt", padding=True, truncation=True, max_length=512).to(device)
     attention_mask = inputs['attention_mask']
     outputs = model.generate(
+        inputs.input_ids,
+        attention_mask=attention_mask,
+        max_new_tokens=500,
+        temperature=0.3,
         do_sample=True,
         pad_token_id=tokenizer.pad_token_id
     )
     response = tokenizer.decode(outputs[0], skip_special_tokens=True)
     return response
+# Definición de la interfaz de Gradio
+with gr.Blocks() as demo:
+    gr.Markdown("# Mejora de Resoluciones Judiciales con GPT Civil")
+    gr.Markdown("Utiliza el modelo Mistral-Nemo-Instruct-2407 para mejorar borradores de resoluciones judiciales.")
+    input_text = gr.Textbox(label="Introduce tu resolución judicial")
+    output_text = gr.Textbox(label="Resolución mejorada")
+    submit_button = gr.Button("Mejorar")
+    submit_button.click(fn=mejorar_resolucion, inputs=input_text, outputs=output_text)
 # Lanzamiento de la aplicación
 demo.launch()