Spaces:

injilashah
/

Bloom_vs_gemma

Sleeping

injilashah commited on Dec 12, 2024

Commit

8e41ed5

verified ·

1 Parent(s): 02714b8

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -7,7 +7,7 @@ device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
 b_tokenizer = AutoTokenizer.from_pretrained("bigscience/bloom-7b1")#using small parameter version of model for faster inference on hf
-b_model = AutoModelForCausalLM.from_pretrained("bigscience/bloom-7b1")
 g_tokenizer = AutoTokenizer.from_pretrained("google/gemma-2-2b",token = hf_token)#using small paramerter version of model for faster inference on hf
 g_model = AutoModelForCausalLM.from_pretrained("google/gemma-2-2b",token = hf_token)

 b_tokenizer = AutoTokenizer.from_pretrained("bigscience/bloom-7b1")#using small parameter version of model for faster inference on hf
+b_model = AutoModelForCausalLM.from_pretrained("bigscience/bloom-7b1",device_map = "auto")
 g_tokenizer = AutoTokenizer.from_pretrained("google/gemma-2-2b",token = hf_token)#using small paramerter version of model for faster inference on hf
 g_model = AutoModelForCausalLM.from_pretrained("google/gemma-2-2b",token = hf_token)