teknium
/

Replit-v1-CodeInstruct-3B-fp16

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

teknium commited on Jun 7, 2023

Commit

3bbb04a

•

1 Parent(s): e340b69

Enable 8/4bit quantization

Files changed (1) hide show

modeling_mpt.py +1 -0

modeling_mpt.py CHANGED Viewed

@@ -23,6 +23,7 @@ Tokenizer = Union[PreTrainedTokenizer, PreTrainedTokenizerFast]
 class MPTPreTrainedModel(PreTrainedModel):
     config_class = MPTConfig
     base_model_prefix = 'model'
 class MPTModel(MPTPreTrainedModel):

 class MPTPreTrainedModel(PreTrainedModel):
     config_class = MPTConfig
     base_model_prefix = 'model'
+    _no_split_modules=["MPTBlock"]
 class MPTModel(MPTPreTrainedModel):