Spaces:

Norod78
/

FantasyChildrenScifi-hebrew-gpt_neo-small

Running

App Files Files Community

Norod78 commited on Jun 12, 2023

Commit

00e184d

1 Parent(s): de72a99

Update to use Gradio, Deepspeed and TextIteratorStreamer

Browse files

Files changed (3) hide show

README.md +1 -1
app.py +62 -130
requirements.txt +2 -1

README.md CHANGED Viewed

@@ -3,7 +3,7 @@ title: Hebrew GPT Neo - Science Fiction and Fantasy
 emoji: 🧙‍♀️
 colorFrom: yellow
 colorTo: blue
-sdk: streamlit
 app_file: app.py
 pinned: false
 license: mit

 emoji: 🧙‍♀️
 colorFrom: yellow
 colorTo: blue
+sdk: gradio
 app_file: app.py
 pinned: false
 license: mit

app.py CHANGED Viewed

@@ -1,134 +1,66 @@
 # -*- coding: utf-8 -*-
-import os
-os.environ["TOKENIZERS_PARALLELISM"] = "false"
-import argparse
-import re
-import streamlit as st
-import random
-import numpy as np
 import torch
-from transformers import AutoTokenizer, AutoModelForCausalLM
-import tokenizers
-random.seed(None)
-suggested_text_list = ['השד הופיע מול','קאלי שלפה את','פעם אחת לפני שנים רבות', 'הארי פוטר חייך חיוך נבוך', 'ואז הפרתי את כל כללי הטקס כש']
-@st.cache_resource
-def load_model(model_name):
-    tokenizer = AutoTokenizer.from_pretrained(model_name)
-    model = AutoModelForCausalLM.from_pretrained(model_name)
-    return model, tokenizer
-def extend(input_text, max_size=20, top_k=50, top_p=0.95, temperature=0.7):
-    if len(input_text) == 0:
-        input_text = "<|startoftext|>"
-    else:
-        input_text = "<|startoftext|>" + input_text
-    encoded_prompt = tokenizer.encode(
-    input_text, add_special_tokens=False, return_tensors="pt")
-    encoded_prompt = encoded_prompt.to(device)
-    if encoded_prompt.size()[-1] == 0:
-        input_ids = None
-    else:
-        input_ids = encoded_prompt
-    output_sequences = model.generate(
-    input_ids=input_ids,
-    max_length=max_size + len(encoded_prompt[0]),
-    top_k=top_k,
-    top_p=top_p,
-    temperature=temperature,
-    do_sample=True,
-    repetition_penalty=2.0,
-    num_return_sequences=1)
-    # Remove the batch dimension when returning multiple sequences
-    if len(output_sequences.shape) > 2:
-        output_sequences.squeeze_()
-    generated_sequences = []
-    for generated_sequence_idx, generated_sequence in enumerate(output_sequences):
-        generated_sequence = generated_sequence.tolist()
-        # Decode text
-        text = tokenizer.decode(generated_sequence, clean_up_tokenization_spaces=True)
-        # Remove all text after the stop token
-        text = text[: text.find(stop_token) if stop_token else None]
-        # Remove all text after 3 newlines
-        text = text[: text.find(new_lines) if new_lines else None]
-        # Add the prompt at the beginning of the sequence. Remove the excess text that was used for pre-processing
-        total_sequence = (
-            input_text + text[len(tokenizer.decode(encoded_prompt[0], clean_up_tokenization_spaces=True)) :]
-        )
-        generated_sequences.append(total_sequence)
-    parsed_text = total_sequence.replace("<|startoftext|>", "").replace("\r","").replace("\n\n", "\n")
-    if len(parsed_text) == 0:
-        parsed_text = "שגיאה"
-    return parsed_text
-if __name__ == "__main__":
-    st.title("Hebrew text generator: Science Fiction and Fantasy (GPT-Neo)")
-    model, tokenizer = load_model("./model")
-    stop_token = "<|endoftext|>"
-    new_lines = "<|pad|>"
-    np.random.seed(None)
-    random_seed = np.random.randint(10000,size=1)
-    device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
-    n_gpu = 0 if torch.cuda.is_available()==False else torch.cuda.device_count()
-    torch.manual_seed(random_seed)
-    if n_gpu > 0:
-        torch.cuda.manual_seed_all(random_seed)
-    model.to(device)
-    text_area = st.text_area("Enter the first few words (or leave blank), tap on \"Generate Text\" below. Tapping again will produce a different result.", 'האדם האחרון עלי אדמות ישב לבד בחדרו כשלפתע נשמעה דפיקה')
-    st.sidebar.subheader("Configurable parameters")
-    max_len = st.sidebar.slider("Max-Length", 0, 256, 160,help="The maximum length of the sequence to be generated.")
-    top_k = st.sidebar.slider("Top-K", 0, 100, 40, help="The number of highest probability vocabulary tokens to keep for top-k-filtering.")
-    top_p = st.sidebar.slider("Top-P", 0.0, 1.0, 0.92, help="If set to float < 1, only the most probable tokens with probabilities that add up to top_p or higher are kept for generation.")
-    temperature = st.sidebar.slider("Temperature", 0.0, 1.0, 1.0, help="The value used to module the randomness of the output tokens.")
-    if st.button("Generate Text"):
-        with st.spinner(text="Generating results..."):
-            st.subheader("Result")
-            print(f"device:{device}, n_gpu:{n_gpu}, random_seed:{random_seed}, maxlen:{max_len}, top_k:{top_k}, top_p:{top_p}")
-            if len(text_area.strip()) == 0:
-                text_area = random.choice(suggested_text_list)
-            result = extend(input_text=text_area,
-                            max_size=int(max_len),
-                            top_k=int(top_k),
-                            top_p=float(top_p),
-                            temperature=float(temperature))
-            print("Done length: " + str(len(result)) + " bytes")
-            #<div class="rtl" dir="rtl" style="text-align:right;">
-            st.markdown(f"<p dir=\"rtl\" style=\"text-align:right;\"> {result} </p>", unsafe_allow_html=True)
-            st.write("\n\nResult length: " + str(len(result)) + " bytes\n Random seed: " + str(random_seed) + "\ntop_k: " + str(top_k) + "\ntop_p: " + str(top_p) + "\ntemperature: " + str(temperature) + "\nmax_len: " + str(max_len) + "\ndevice: " + str(device) + "\nn_gpu: " + str(n_gpu))
-            print(f"\"{result}\"")
-    st.markdown(
-        """Hebrew text generation model based on EleutherAI's gpt-neo architecture. Originally trained on a TPUv3-8 which was made avilable to me via the [TPU Research Cloud Program](https://sites.research.google/trc/). The model was then slightly fine-tuned upon science fiction and fantasy text."""
-    )
-    st.markdown("<footer><hr><p style=\"font-size:14px\">The site is fan made and is not affiliated with any author in any way.</p><p style=\"font-size:12px\">By <a href=\"https://linktr.ee/Norod78\">Doron Adler</a></p></footer> ", unsafe_allow_html=True)

 # -*- coding: utf-8 -*-
+import gradio as gr
 import torch
+from transformers import pipeline, AutoModelForCausalLM, AutoTokenizer, TextIteratorStreamer
+from threading import Thread
+import os
+model_id = './model'
+CUDA_AVAILABLE = torch.cuda.is_available()
+device = torch.device("cuda" if CUDA_AVAILABLE else "cpu")
+generator = pipeline('text-generation', model=model_id,
+                     tokenizer=model_id,
+                     load_in_8bit=True,
+                     device=device)
+early_stop_pattern = "\n\n\n"
+print(f'Early stop pattern = \"{early_stop_pattern}\"')
+model = generator.model
+tok = generator.tokenizer
+stop_token = tok.eos_token
+print(f'stop_token = \"{stop_token}\"')
+def generate(text = ""):
+  print("Create streamer")
+  yield  "[אנא המתינו לתשובה]"
+  streamer = TextIteratorStreamer(tok, timeout=5.)
+  if len(text) == 0:
+    text = "\n"
+  inputs = tok([text], return_tensors="pt").to(device)
+  generation_kwargs = dict(inputs, streamer=streamer, repetition_penalty=2.5, do_sample=True, top_k=40, top_p=0.2, temperature=0.4, num_beams = 1 ,max_new_tokens=128, pad_token_id = model.config.eos_token_id, early_stopping=True, no_repeat_ngram_size=4)
+  thread = Thread(target=model.generate, kwargs=generation_kwargs)
+  thread.start()
+  generated_text = ""
+  for new_text in streamer:
+    yield generated_text + new_text
+    print(new_text, end ="")
+    generated_text += new_text
+    if (early_stop_pattern in generated_text) or (stop_token in new_text):
+      generated_text = generated_text[: generated_text.find(early_stop_pattern) if early_stop_pattern else None]
+      generated_text = generated_text[: generated_text.find(stop_token) if stop_token else None]
+      streamer.end()
+      print("\n--\n")
+      yield generated_text
+      return generated_text
+  return generated_text
+demo = gr.Interface(
+    title="Hebrew text generator: Science Fiction and Fantasy (GPT-Neo)",
+    fn=generate,
+    inputs=gr.Textbox(label="כתבו כאן את הטקסט שלכם או השאירו ריק", elem_id="input_text"),
+    outputs=gr.Textbox(type="text", label="פה יופיע הטקסט שהמחולל יחולל", elem_id="output_text"),
+    css="#output_text{direction: rtl} #input_text{direction: rtl}",
+    examples = ['השד הופיע מול','קאלי שלפה את','פעם אחת לפני שנים רבות', 'הארי פוטר חייך חיוך נבוך', 'ואז הפרתי את כל כללי הטקס כש'],
+    allow_flagging=False
+)
+demo.queue()
+#demo.launch(debug=True)
+demo.launch()

requirements.txt CHANGED Viewed

@@ -1,4 +1,5 @@
-streamlit
 transformers
 tokenizers
 torch

+gradio
 transformers
 tokenizers
 torch
+deepspeed