Spaces:

Didier
/

Text_translation

Running

Didier commited on Sep 17, 2024

Commit

efcd81a

1 Parent(s): 690d91f

CUDA or not CUDA

Files changed (1) hide show

model_translation.py CHANGED Viewed

@@ -25,7 +25,7 @@ model_names = {
 # Registry for all loaded bilingual models
 tokenizer_model_registry = {}
-device = 'cuda' if torch.cuda.is_available() else 'cpu'
 def get_tokenizer_model_for_src_lang(src_lang: str) -> (AutoTokenizer, AutoModelForSeq2SeqLM):
     """
@@ -47,7 +47,7 @@ def get_tokenizer_model_for_src_lang(src_lang: str) -> (AutoTokenizer, AutoModel
     model = AutoModelForSeq2SeqLM.from_pretrained(model_name)
     if model.config.torch_dtype != torch.float16:
         model = model.half()
-    model = model.to(device)
     tokenizer_model_registry[src_lang] = (tokenizer, model)
     return (tokenizer, model)
@@ -65,5 +65,8 @@ model_MADLAD_name = "google/madlad400-3b-mt"
 #model_MADLAD_name = "google/madlad400-7b-mt-bt"
 tokenizer_multilingual = AutoTokenizer.from_pretrained(model_MADLAD_name, use_fast=True)
 model_multilingual = AutoModelForSeq2SeqLM.from_pretrained(
-    model_MADLAD_name, device_map="auto", torch_dtype=torch.float16)

 # Registry for all loaded bilingual models
 tokenizer_model_registry = {}
+device = 'cpu'
 def get_tokenizer_model_for_src_lang(src_lang: str) -> (AutoTokenizer, AutoModelForSeq2SeqLM):
     """
     model = AutoModelForSeq2SeqLM.from_pretrained(model_name)
     if model.config.torch_dtype != torch.float16:
         model = model.half()
+    model.to(device)
     tokenizer_model_registry[src_lang] = (tokenizer, model)
     return (tokenizer, model)
 #model_MADLAD_name = "google/madlad400-7b-mt-bt"
 tokenizer_multilingual = AutoTokenizer.from_pretrained(model_MADLAD_name, use_fast=True)
 model_multilingual = AutoModelForSeq2SeqLM.from_pretrained(
+    model_MADLAD_name,
+    device_map="auto",
+    torch_dtype=torch.float16
+    low_cpu_mem_usage=True)