seantyh
/

mpt-1b-rp200b-dolly

Text Generation

Model card Files Files and versions Community

seantyh commited on May 12, 2023

Commit

131fbe3

·

1 Parent(s): fed4d14

add peft compatibility code

Files changed (1) hide show

mosaic_gpt.py +5 -0

mosaic_gpt.py CHANGED Viewed

@@ -236,6 +236,7 @@ class MosaicGPT(PreTrainedModel):
     def forward(
             self,
             input_ids: torch.LongTensor,
             past_key_values: Optional[List[Tuple[torch.FloatTensor]]] = None,
             attention_mask: Optional[torch.ByteTensor] = None,
             prefix_mask: Optional[torch.ByteTensor] = None,
@@ -243,7 +244,11 @@ class MosaicGPT(PreTrainedModel):
             return_dict: Optional[bool] = None,
             output_attentions: Optional[bool] = None,
             output_hidden_states: Optional[bool] = None,
             use_cache: Optional[bool] = None):
         return_dict = return_dict if return_dict is not None else self.config.return_dict
         use_cache = use_cache if use_cache is not None else self.config.use_cache

     def forward(
             self,
             input_ids: torch.LongTensor,
+            inputs_embeds: Optional[torch.FloatTensor] = None,
             past_key_values: Optional[List[Tuple[torch.FloatTensor]]] = None,
             attention_mask: Optional[torch.ByteTensor] = None,
             prefix_mask: Optional[torch.ByteTensor] = None,
             return_dict: Optional[bool] = None,
             output_attentions: Optional[bool] = None,
             output_hidden_states: Optional[bool] = None,
+            labels: Optional[torch.LongTensor] = None,
             use_cache: Optional[bool] = None):
+        assert inputs_embeds is None   # for compatibility for PEFT LoRA
+        assert labels is None   # for compatibility for PEFT LoRA
         return_dict = return_dict if return_dict is not None else self.config.return_dict
         use_cache = use_cache if use_cache is not None else self.config.use_cache