AlexWortega
/

instruct_rugptlarge

Text Generation

Inference Endpoints

text-generation-inference

Model card Files Files and versions Community

AlexWortega commited on Apr 1, 2023

Commit

ec565ff

•

1 Parent(s): 787d54b

Update README.md

Files changed (1) hide show

README.md +26 -7

README.md CHANGED Viewed

@@ -48,13 +48,7 @@ tags:
 # Quick Start
-```python
-from transformers import pipeline
-#в душе не ебу будет ли норм работать, ставлю жопу автора хф что токенайзер мисматчнет с моделью, вообще грузите по нормальному
-pipe = pipeline(model='AlexWortega/instruct_rugptlarge')
-pipe('''Как собрать питон код?''')
-```
-or
 ```python
 from transformers import GPT2TokenizerFast,GPT2LMHeadModel
 tokenizer = GPT2TokenizerFast.from_pretrained("AlexWortega/instruct_rugptlarge")
@@ -66,6 +60,31 @@ model = GPT2LMHeadModel.from_pretrained("AlexWortega/instruct_rugptlarge")
 model.to(device)
 model.resize_token_embeddings(len(tokenizer))
 ```
 обратите внимание, что лучшие параметры для генерации
 ```

 # Quick Start
 ```python
 from transformers import GPT2TokenizerFast,GPT2LMHeadModel
 tokenizer = GPT2TokenizerFast.from_pretrained("AlexWortega/instruct_rugptlarge")
 model.to(device)
 model.resize_token_embeddings(len(tokenizer))
+def generate_seqs(q,model, k=2):
+    gen_kwargs = {
+        "min_length": 20,
+        "max_new_tokens": 100,
+        "top_k": 50,
+        "top_p": 0.7,
+        "do_sample": True,
+        "early_stopping": True,
+        "no_repeat_ngram_size": 2,
+        "eos_token_id": tokenizer.eos_token_id,
+        "pad_token_id": tokenizer.eos_token_id,
+        "use_cache": True,
+        "repetition_penalty": 1.5,
+        "length_penalty": 1.2,
+        "num_beams": 4,
+        "num_return_sequences": k
+    }
+    q = q + '<instructionS>'
+    t = tokenizer.encode(q, return_tensors='pt').to(device)
+    g = model.generate(t, **gen_kwargs)
+    generated_sequences = tokenizer.batch_decode(g, skip_special_tokens=True)
+    return  generated_sequences
 ```
 обратите внимание, что лучшие параметры для генерации
 ```