Spaces:

nicolasmarques
/

gpt2-app-nicolas

Runtime error

App Files Files

xet

Community

nicolasmarques commited on Jun 30

Commit

2bc0299

verified ·

1 Parent(s): 1258a35

Update app.py

Browse files

Files changed (1) hide show

app.py +100 -17

app.py CHANGED Viewed

@@ -1,22 +1,105 @@
 from transformers import pipeline
 import gradio as gr
-generator = pipeline("text-generation", model="gpt2")
-def generate_response(text, command):
-    prompt = f"{command}: {text}"
-    result = generator(prompt, max_new_tokens=150, temperature=0.9, do_sample=True)
-    return result[0]["generated_text"].replace(prompt, "").strip()
-interface = gr.Interface(
-    fn=generate_response,
-    inputs=[
-        gr.Textbox(lines=5, label="Texto de entrada"),
-        gr.Dropdown(choices=["Expandir", "Resumir", "Simplificar", "Continuar"], label="Comando")
-    ],
-    outputs=gr.Textbox(label="Resposta gerada"),
-    title="GPT-2 App Sr. Nicolas",
-    description="Digite um texto e selecione o comando desejado."
 )
-interface.launch()

+# app.py
+import re
+from langdetect import detect, DetectorFactory
 from transformers import pipeline
 import gradio as gr
+# tornar detecção determinística
+DetectorFactory.seed = 0
+# Pipeline principal de geração multimodal/multilíngue
+generator = pipeline(
+    "text-generation",
+    model="bigscience/bloom-560m",
+    device_map="auto"  # usa GPU se disponível
+)
+# Mapeamento de ações a palavras-chave em vários idiomas
+ACTIONS = {
+    "expand":   {"en": ["expand", "detail", "add"],  "pt": ["expanda", "expandir", "detalhe"], "fr": ["développer"]},
+    "summarize":{"en": ["summarize", "summarise", "summary"], "pt": ["resuma", "resumir", "resumo"], "fr": ["résumer"]},
+    "simplify": {"en": ["simplify"],               "pt": ["simplifique", "simplificar"],       "fr": ["simplifier"]},
+    "continue": {"en": ["continue", "cont"],       "pt": ["continue", "continuar"],           "fr": ["continuer"]},
+}
+# Frases de instrução por idioma
+INSTRUCTION = {
+    "expand": {
+        "en": "Please expand and detail the following text:",
+        "pt": "Por favor, expanda e detalhe o texto a seguir:",
+        "fr": "Veuillez développer et détailler le texte suivant :"
+    },
+    "summarize": {
+        "en": "Please provide a concise summary of the following text:",
+        "pt": "Por favor, forneça um resumo conciso do texto a seguir:",
+        "fr": "Veuillez fournir un résumé concis du texte suivant :"
+    },
+    "simplify": {
+        "en": "Please simplify the following text:",
+        "pt": "Por favor, simplifique o texto a seguir:",
+        "fr": "Veuillez simplifier le texte suivant :"
+    },
+    "continue": {
+        "en": "Please continue writing the following text:",
+        "pt": "Por favor, continue o texto a seguir:",
+        "fr": "Veuillez continuer le texte suivant :"
+    },
+}
+# Frase de humanização por idioma
+HUMANIZE = {
+    "en": "Please make the following text more natural and human-like:",
+    "pt": "Por favor, torne o texto a seguir mais natural e humano:",
+    "fr": "Veuillez rendre le texte suivant plus naturel et humain :"
+}
+def detect_language(text):
+    try:
+        code = detect(text)
+    except:
+        code = "en"
+    return code if code in ["en", "pt", "fr"] else "en"
+def detect_action(text, lang):
+    txt = text.lower()
+    for action, kwmap in ACTIONS.items():
+        for kw in kwmap.get(lang, []):
+            if re.search(rf"\b{kw}\b", txt):
+                return action
+    return "continue"
+def clean_text(text, lang):
+    # Remove as palavras-chave de comando para não poluir o prompt
+    txt = text
+    for kw in sum(ACTIONS.values(), []):
+        txt = re.sub(rf"\b{kw}\b", "", txt, flags=re.IGNORECASE)
+    return txt.strip()
+def gerar(texto):
+    # 1. Detecta idioma e ação
+    lang = detect_language(texto)
+    action = detect_action(texto, lang)
+    # 2. Limpa o texto
+    core = clean_text(texto, lang)
+    # 3. Gera segundo instrução apropriada
+    prompt1 = f"{INSTRUCTION[action][lang]}\n\n{core}\n\n"
+    out1 = generator(prompt1, max_new_tokens=200, temperature=0.7, top_p=0.9)[0]["generated_text"]
+    # Retira o prompt do início
+    result1 = out1.replace(prompt1, "").strip()
+    # 4. Humaniza o texto
+    prompt2 = f"{HUMANIZE[lang]}\n\n{result1}\n\n"
+    out2 = generator(prompt2, max_new_tokens=100, temperature=0.6, top_p=0.8)[0]["generated_text"]
+    result2 = out2.replace(prompt2, "").strip()
+    return result2
+# Interface Gradio
+app = gr.Interface(
+    fn=gerar,
+    inputs=gr.Textbox(lines=6, placeholder="Digite seu texto e o comando embutido (ex: 'Por favor, resuma isto')...", label="Entrada"),
+    outputs=gr.Textbox(label="Resposta IA (mesmo idioma)"),
+    title="GPT Multilingue Sr. Nicolas",
+    description="Digite um texto com naturalidade (em pt/en/fr). A IA detecta idioma, executa comando embutido (resuma, expanda, simplifique, continue) e devolve texto humanizado.",
+    allow_flagging="never"
 )
+app.launch()