Spaces:

nicolasmarques
/

gpt2-app-nicolas

Runtime error

App Files Files Community

nicolasmarques commited on Jun 30

Commit

8bcd145

verified ·

1 Parent(s): 2d31838

Update app.py

Browse files

Files changed (1) hide show

app.py +10 -14

app.py CHANGED Viewed

@@ -1,3 +1,4 @@
 import re
 from langdetect import detect, DetectorFactory
 from transformers import pipeline
@@ -6,19 +7,19 @@ import gradio as gr
 # Garante resultados determinísticos em detect()
 DetectorFactory.seed = 0
-# Carrega o modelo PT-Falcon pequeno (620M params) em CPU
 generator = pipeline(
     "text-generation",
-    model="cachya/pt-falcon-small",
     device=-1
 )
-# Mapeia comandos e palavras-chave em pt/en/fr
 COMMANDS = {
-    "resumo":   ["resuma", "resumo", "resumir"],
-    "reescrever": ["reescreva", "reformule", "reformular"],
-    "expandir": ["expanda", "expansão", "expandir", "detalhe"],
-    "corrigir": ["corrija", "corrigir", "melhore", "revise"]
 }
 HUMANIZE_PROMPT = {
@@ -34,7 +35,7 @@ def detect_language(text: str) -> str:
     except:
         return "pt"
-def find_command(text: str, lang: str) -> str:
     low = text.lower()
     for cmd, kws in COMMANDS.items():
         for kw in kws:
@@ -43,7 +44,6 @@ def find_command(text: str, lang: str) -> str:
     return "gerar"
 def clean_text(text: str) -> str:
-    # remove múltiplos espaços e palavras-chave
     txt = re.sub(r"\s+", " ", text)
     for kws in COMMANDS.values():
         for kw in kws:
@@ -81,23 +81,19 @@ def build_prompt(core: str, cmd: str, lang: str) -> str:
 def gerar_resposta(texto: str) -> str:
     lang = detect_language(texto)
-    cmd  = find_command(texto, lang)
     core = clean_text(texto)
-    # 1) Geração principal
     prompt1 = build_prompt(core, cmd, lang)
     out1 = generator(prompt1, max_new_tokens=200, temperature=0.7, top_p=0.9)[0]["generated_text"]
-    # retira o próprio prompt
     res1 = out1.replace(prompt1, "").strip()
-    # 2) Humanização final
     prompt2 = HUMANIZE_PROMPT[lang] + res1 + "\n\n"
     out2 = generator(prompt2, max_new_tokens=100, temperature=0.6, top_p=0.8)[0]["generated_text"]
     res2 = out2.replace(prompt2, "").strip()
     return res2
-# Interface Gradio
 demo = gr.Interface(
     fn=gerar_resposta,
     inputs=gr.Textbox(lines=6, placeholder="Digite seu texto com 'resuma', 'expanda', etc...", label="Entrada"),

 import re
 from langdetect import detect, DetectorFactory
 from transformers import pipeline
 # Garante resultados determinísticos em detect()
 DetectorFactory.seed = 0
+# Carregando o modelo GPT2 pequeno em português (CPU)
 generator = pipeline(
     "text-generation",
+    model="pierreguillou/gpt2-small-portuguese",
     device=-1
 )
+# Comandos e palavras-chave em pt/en/fr
 COMMANDS = {
+    "resumo":   ["resuma", "resumo", "resumir", "summarize", "résumé", "résumer"],
+    "reescrever": ["reescreva", "reformule", "reformular", "rewrite", "réécrire"],
+    "expandir": ["expanda", "expansão", "expandir", "detalhe", "expand", "développez"],
+    "corrigir": ["corrija", "corrigir", "melhore", "revise", "correct", "corriger"]
 }
 HUMANIZE_PROMPT = {
     except:
         return "pt"
+def find_command(text: str) -> str:
     low = text.lower()
     for cmd, kws in COMMANDS.items():
         for kw in kws:
     return "gerar"
 def clean_text(text: str) -> str:
     txt = re.sub(r"\s+", " ", text)
     for kws in COMMANDS.values():
         for kw in kws:
 def gerar_resposta(texto: str) -> str:
     lang = detect_language(texto)
+    cmd  = find_command(texto)
     core = clean_text(texto)
     prompt1 = build_prompt(core, cmd, lang)
     out1 = generator(prompt1, max_new_tokens=200, temperature=0.7, top_p=0.9)[0]["generated_text"]
     res1 = out1.replace(prompt1, "").strip()
     prompt2 = HUMANIZE_PROMPT[lang] + res1 + "\n\n"
     out2 = generator(prompt2, max_new_tokens=100, temperature=0.6, top_p=0.8)[0]["generated_text"]
     res2 = out2.replace(prompt2, "").strip()
     return res2
 demo = gr.Interface(
     fn=gerar_resposta,
     inputs=gr.Textbox(lines=6, placeholder="Digite seu texto com 'resuma', 'expanda', etc...", label="Entrada"),