Spaces:

niclasfw
/

schlager-bot-4

Sleeping

niclasfw commited on Dec 1, 2023

Commit

84b5b05

•

1 Parent(s): a088b25

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -3,27 +3,27 @@ from transformers import AutoModelForCausalLM, AutoTokenizer
 from transformers import pipeline
-# @st.cache(allow_output_mutation=True)
-# def get_model():
-#     # load base LLM model and tokenizer
-#     model_id = "niclasfw/schlager-bot-004"
-#     tokenizer = AutoTokenizer.from_pretrained(model_id)
-#     model = AutoModelForCausalLM.from_pretrained(
-#     model_id,
-#     # low_cpu_mem_usage=True,
-#     # torch_dtype=torch.float16,
-#     # load_in_4bit=True,
-#     )
-#     return tokenizer, model
-# tokenizer, model = get_model()
-model_id = "niclasfw/schlager-bot-004"
-model = AutoModelForCausalLM.from_pretrained(model_id)
-tokenizer = AutoTokenizer.from_pretrained(model_id)
 # generator = pipeline(task="text-generation", model=model_id, tokenizer=model_id)
@@ -46,7 +46,7 @@ if user_input and button:
     # input = tokenizer(prompt, padding=True, return_tensors="pt")
     # generate_ids = model.generate(input.input_ids, max_length=500, top_p=0.75, temperature=0.95, top_k=15)
     # output = tokenizer.batch_decode(generate_ids, skip_special_tokens=True, clean_up_tokenization_spaces=False)[0]
-    input_ids = tokenizer(prompt, return_tensors="pt", truncation=True)
     outputs = model.generate(input_ids=input_ids, pad_token_id=tokenizer.eos_token_id, max_new_tokens=500, do_sample=True, top_p=0.75, temperature=0.95, top_k=15)
     st.write(output)

 from transformers import pipeline
+@st.cache(allow_output_mutation=True)
+def get_model():
+    # load base LLM model and tokenizer
+    model_id = "niclasfw/schlager-bot-004"
+    tokenizer = AutoTokenizer.from_pretrained(model_id)
+    model = AutoModelForCausalLM.from_pretrained(
+    model_id,
+    low_cpu_mem_usage=True,
+    torch_dtype=torch.float16,
+    load_in_4bit=True,
+    )
+    return tokenizer, model
+tokenizer, model = get_model()
+# model_id = "niclasfw/schlager-bot-004"
+# model = AutoModelForCausalLM.from_pretrained(model_id)
+# tokenizer = AutoTokenizer.from_pretrained(model_id)
 # generator = pipeline(task="text-generation", model=model_id, tokenizer=model_id)
     # input = tokenizer(prompt, padding=True, return_tensors="pt")
     # generate_ids = model.generate(input.input_ids, max_length=500, top_p=0.75, temperature=0.95, top_k=15)
     # output = tokenizer.batch_decode(generate_ids, skip_special_tokens=True, clean_up_tokenization_spaces=False)[0]
+    input_ids = tokenizer(prompt, return_tensors="pt", truncation=True).input_ids.cuda()
     outputs = model.generate(input_ids=input_ids, pad_token_id=tokenizer.eos_token_id, max_new_tokens=500, do_sample=True, top_p=0.75, temperature=0.95, top_k=15)
     st.write(output)