efederici
/

ipt-350m

Text Generation

text-generation-inference

text generation

Model card Files Files and versions Community

efederici commited on Jun 6, 2023

Commit

e6b1b73

•

1 Parent(s): af578b1

Update README.md

Files changed (1) hide show

README.md +3 -3

README.md CHANGED Viewed

@@ -27,7 +27,7 @@ ipt-350m is:
 ```python
 import transformers
 model = transformers.AutoModelForCausalLM.from_pretrained(
-  'efederici/ipt-350m-alibi',
   trust_remote_code=True
 )
 ```
@@ -38,7 +38,7 @@ To use the optimized [triton implementation](https://github.com/openai/triton) o
 import torch
 import transformers
-name = 'efederici/ipt-350m-alibi'
 config = transformers.AutoConfig.from_pretrained(name, trust_remote_code=True)
 config.attn_config['attn_impl'] = 'triton'
@@ -57,7 +57,7 @@ Although the model was trained with a sequence length of 2048, ALiBi enables to
 ```python
 import transformers
-name = 'efederici/ipt-350m-alibi'
 config = transformers.AutoConfig.from_pretrained(name, trust_remote_code=True)
 config.max_seq_len = 4096 # (input + output) tokens can now be up to 4096

 ```python
 import transformers
 model = transformers.AutoModelForCausalLM.from_pretrained(
+  'efederici/ipt-350m',
   trust_remote_code=True
 )
 ```
 import torch
 import transformers
+name = 'efederici/ipt-350m'
 config = transformers.AutoConfig.from_pretrained(name, trust_remote_code=True)
 config.attn_config['attn_impl'] = 'triton'
 ```python
 import transformers
+name = 'efederici/ipt-350m'
 config = transformers.AutoConfig.from_pretrained(name, trust_remote_code=True)
 config.max_seq_len = 4096 # (input + output) tokens can now be up to 4096