compatible with DirectML/ROCm

Tensor.new is a deprecated constructor and does not support PrivateUse1 in pytorch 1.13.1/2.0.0, use torch.ones() instead. Please refer to https://github.com/microsoft/DirectML/issues/400 and https://github.com/pytorch/pytorch/issues/95734 and https://huggingface.co/THUDM/chatglm2-6b/discussions/71 for more detail. This should also fix the ROCm compatibility in this file.

Files changed (1) hide show

modeling_chatglm.py +2 -1

modeling_chatglm.py CHANGED Viewed

@@ -16,6 +16,7 @@ from transformers.modeling_outputs import (
     BaseModelOutputWithPast,
     CausalLMOutputWithPast,
 )
 from transformers.modeling_utils import PreTrainedModel
 from transformers.utils import logging
 from transformers.generation.logits_process import LogitsProcessor
@@ -1138,7 +1139,7 @@ class ChatGLMForConditionalGeneration(ChatGLMPreTrainedModel):
         )
         logits_warper = self._get_logits_warper(generation_config)
-        unfinished_sequences = input_ids.new(input_ids.shape[0]).fill_(1)
         scores = None
         while True:
             model_inputs = self.prepare_inputs_for_generation(input_ids, **model_kwargs)

     BaseModelOutputWithPast,
     CausalLMOutputWithPast,
 )
 from transformers.modeling_utils import PreTrainedModel
 from transformers.utils import logging
 from transformers.generation.logits_process import LogitsProcessor
         )
         logits_warper = self._get_logits_warper(generation_config)
+        unfinished_sequences = torch.ones(input_ids.shape[0], device=input_ids.device, dtype=input_ids.dtype)
         scores = None
         while True:
             model_inputs = self.prepare_inputs_for_generation(input_ids, **model_kwargs)