Spaces:

Didier
/

Text_translation

Running

Didier commited on Sep 25, 2024

Commit

5d580b9

1 Parent(s): 200d05c

Removing bitsandbytes quantization to 8 bits

Files changed (1) hide show

model_translation.py CHANGED Viewed

@@ -209,8 +209,8 @@ class ModelM2M100(metaclass=Singleton):
             self._model_name,
             device_map="auto",
             torch_dtype=torch.float16,
-            low_cpu_mem_usage=True,
-            quantization_config=quantization_config
         )
         self._model = torch.compile(self._model)

             self._model_name,
             device_map="auto",
             torch_dtype=torch.float16,
+            low_cpu_mem_usage=True
+            #quantization_config=quantization_config
         )
         self._model = torch.compile(self._model)