paraphrase_de

Runtime error

App Files Files Community

milyiyo commited on Feb 4, 2023

Commit

5a34301

•

0 Parent(s):

Duplicate from milyiyo/paraphrase_es

Browse files

Files changed (4) hide show

.gitattributes +33 -0
README.md +13 -0
app.py +70 -0
requirements.txt +6 -0

.gitattributes ADDED Viewed

	@@ -0,0 +1,33 @@

+*.7z filter=lfs diff=lfs merge=lfs -text
+*.arrow filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.bz2 filter=lfs diff=lfs merge=lfs -text
+*.ftz filter=lfs diff=lfs merge=lfs -text
+*.gz filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.joblib filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.mlmodel filter=lfs diff=lfs merge=lfs -text
+*.model filter=lfs diff=lfs merge=lfs -text
+*.msgpack filter=lfs diff=lfs merge=lfs -text
+*.npy filter=lfs diff=lfs merge=lfs -text
+*.npz filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.parquet filter=lfs diff=lfs merge=lfs -text
+*.pb filter=lfs diff=lfs merge=lfs -text
+*.pickle filter=lfs diff=lfs merge=lfs -text
+*.pkl filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text
+*.rar filter=lfs diff=lfs merge=lfs -text
+*.safetensors filter=lfs diff=lfs merge=lfs -text
+saved_model/**/* filter=lfs diff=lfs merge=lfs -text
+*.tar.* filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tgz filter=lfs diff=lfs merge=lfs -text
+*.wasm filter=lfs diff=lfs merge=lfs -text
+*.xz filter=lfs diff=lfs merge=lfs -text
+*.zip filter=lfs diff=lfs merge=lfs -text
+*.zst filter=lfs diff=lfs merge=lfs -text
+*tfevents* filter=lfs diff=lfs merge=lfs -text

README.md ADDED Viewed

	@@ -0,0 +1,13 @@

+---
+title: Paraphrase Es
+emoji: 🏢
+colorFrom: red
+colorTo: red
+sdk: gradio
+sdk_version: 3.8
+app_file: app.py
+pinned: false
+duplicated_from: milyiyo/paraphrase_es
+---
+Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

app.py ADDED Viewed

	@@ -0,0 +1,70 @@

+import os
+import gradio as gr
+from transformers import AutoTokenizer, AutoModelForSeq2SeqLM, pipeline
+tokenizer = AutoTokenizer.from_pretrained(
+    "prithivida/parrot_paraphraser_on_T5", use_auth_token=os.environ["AUTH_TOKEN"])
+model = AutoModelForSeq2SeqLM.from_pretrained(
+    "prithivida/parrot_paraphraser_on_T5", use_auth_token=os.environ["AUTH_TOKEN"])
+pln_es_to_en = pipeline('translation_es_to_en',
+                        model=AutoModelForSeq2SeqLM.from_pretrained(
+                            'Helsinki-NLP/opus-mt-es-en'),
+                        tokenizer=AutoTokenizer.from_pretrained(
+                            'Helsinki-NLP/opus-mt-es-en')
+                        )
+pln_en_to_es = pipeline('translation_en_to_es',
+                        model=AutoModelForSeq2SeqLM.from_pretrained(
+                            'Helsinki-NLP/opus-mt-en-es'),
+                        tokenizer=AutoTokenizer.from_pretrained(
+                            'Helsinki-NLP/opus-mt-en-es')
+                        )
+def paraphrase(sentence: str, lang: str, count: str):
+    p_count = int(count)
+    if p_count <= 0 or len(sentence.strip()) == 0:
+        return {'result': []}
+    sentence_input = sentence
+    if lang == 'ES':
+        sentence_input = pln_es_to_en(sentence_input)[0]['translation_text']
+    text = f"paraphrase: {sentence_input} </s>"
+    encoding = tokenizer.encode_plus(text, padding=True, return_tensors="pt")
+    input_ids, attention_masks = encoding["input_ids"], encoding["attention_mask"]
+    outputs = model.generate(
+        input_ids=input_ids, attention_mask=attention_masks,
+        max_length=512,  # 256,
+        do_sample=True,
+        top_k=120,
+        top_p=0.95,
+        early_stopping=True,
+        num_return_sequences=p_count
+    )
+    res = []
+    for output in outputs:
+        line = tokenizer.decode(
+            output, skip_special_tokens=True, clean_up_tokenization_spaces=True)
+        res.append(line)
+    if lang == 'EN':
+        return {'result': res}
+    else:
+        res_es = [pln_en_to_es(x)[0]['translation_text']
+                  for x in res]
+        return {'result': res_es}
+def paraphrase_dummy(sentence: str, lang: str, count: str):
+    return {'result': []}
+iface = gr.Interface(fn=paraphrase,
+                     inputs=[
+                         gr.inputs.Textbox(
+                             lines=2, placeholder=None, label='Sentence'),
+                         gr.inputs.Dropdown(
+                             ['ES', 'EN'], type="value", label='Language'),
+                         gr.inputs.Number(
+                             default=3, label='Paraphrases count'),
+                     ],
+                     outputs=[gr.outputs.JSON(label=None)])
+iface.launch()

requirements.txt ADDED Viewed

	@@ -0,0 +1,6 @@

+transformers
+torch
+sentencepiece
+# Recommended in a warning during pip install
+sacremoses