Spaces:

Remostart
/

Cardano_7B

Sleeping

Remostart commited on Sep 7

Commit

0e96995

verified ·

1 Parent(s): c4a6465

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,21 +1,15 @@
 import gradio as gr
 import torch
-from transformers import AutoModelForCausalLM, AutoTokenizer, BitsAndBytesConfig
 from spaces import GPU
 # Load model & tokenizer
 MODEL_NAME = "ubiodee/plutus_llm"
-quantization_config = BitsAndBytesConfig(
-    load_in_8bit=True,
-    bnb_8bit_compute_dtype=torch.float16,
-    bnb_8bit_use_double_quant=True
-)
 tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME, use_fast=False)
 model = AutoModelForCausalLM.from_pretrained(
     MODEL_NAME,
-    quantization_config=quantization_config,
-    device_map="auto",
-    torch_dtype=torch.float16
 )
 # Set padding token

 import gradio as gr
 import torch
+from transformers import AutoModelForCausalLM, AutoTokenizer
 from spaces import GPU
 # Load model & tokenizer
 MODEL_NAME = "ubiodee/plutus_llm"
 tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME, use_fast=False)
 model = AutoModelForCausalLM.from_pretrained(
     MODEL_NAME,
+    torch_dtype=torch.float16,  # Use FP16 to reduce memory usage
+    device_map="auto"  # Automatically distribute across CPU/GPU
 )
 # Set padding token