littleworth
/

protgpt2-distilled-tiny

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

littleworth commited on May 7

Commit

aa08ba0

•

1 Parent(s): b7edfc6

Update README.md

Files changed (1) hide show

README.md +13 -11

README.md CHANGED Viewed

@@ -47,16 +47,13 @@ model_name = "littleworth/protgpt2-distilled-tiny"
 tokenizer = GPT2Tokenizer.from_pretrained(model_name)
 model = GPT2LMHeadModel.from_pretrained(model_name)
-# Ensure tokenizer is padding from the left
-tokenizer.padding_side = "left"
 # Initialize the pipeline
 text_generator = TextGenerationPipeline(
     model=model, tokenizer=tokenizer, device=0
 )  # specify device if needed
 # Generate sequences
-sequences = text_generator(
     "<|endoftext|>",
     max_length=100,
     do_sample=True,
@@ -68,15 +65,20 @@ sequences = text_generator(
     truncation=True,
 )
-for i, seq in enumerate(sequences):
-    seq["generated_text"] = seq["generated_text"].replace("<|endoftext|>", "")
     # Remove newline characters and non-alphabetical characters
-    seq["generated_text"] = "".join(
-        char for char in seq["generated_text"] if char.isalpha()
-    )
     print(f">Seq_{i}")
-    print(seq["generated_text"])
 ```
 ### Use Cases

 tokenizer = GPT2Tokenizer.from_pretrained(model_name)
 model = GPT2LMHeadModel.from_pretrained(model_name)
 # Initialize the pipeline
 text_generator = TextGenerationPipeline(
     model=model, tokenizer=tokenizer, device=0
 )  # specify device if needed
 # Generate sequences
+generated_sequences = text_generator(
     "<|endoftext|>",
     max_length=100,
     do_sample=True,
     truncation=True,
 )
+def clean_sequence(text):
+    # Remove the "<|endoftext|>" token
+    text = text.replace("<|endoftext|>", "")
     # Remove newline characters and non-alphabetical characters
+    text = "".join(char for char in text if char.isalpha())
+    return text
+# Print the generated sequences
+for i, seq in enumerate(generated_sequences):
+    cleaned_text = clean_sequence(seq["generated_text"])
     print(f">Seq_{i}")
+    print(cleaned_text)
 ```
 ### Use Cases