MambaTonic

Runtime error

Tonic commited on Dec 6, 2023

Commit

74d73f1

•

1 Parent(s): f8e11cc

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,21 +1,20 @@
 import torch
 import torch.nn.functional as F
 from einops import rearrange
 import gradio as gr
 from transformers import AutoTokenizer, AutoModelForCausalLM
 from mamba_ssm.models.mixer_seq_simple import MambaLMHeadModel
 device = "cuda" if torch.cuda.is_available() else "cpu"
 tokenizer = AutoTokenizer.from_pretrained("EleutherAI/gpt-neox-20b")
-model = MambaLMHeadModel.from_pretrained("state-spaces/mamba-2.8b", device=device, dtype="auto")
 def pred(text_in, temperature, top_k, top_p, gen_length, cg, return_dict_in_generate, output_scores, enable_timing):
     tokens = tokenizer(text_in, return_tensors="pt")
     input_ids = tokens.input_ids.to(device=device)
-    max_length = input_ids.shape[1] + gen_length
     out = model.generate(
         input_ids=input_ids,
         max_length=max_length,

 import torch
 import torch.nn.functional as F
+import einops
 from einops import rearrange
 import gradio as gr
 from transformers import AutoTokenizer, AutoModelForCausalLM
 from mamba_ssm.models.mixer_seq_simple import MambaLMHeadModel
 device = "cuda" if torch.cuda.is_available() else "cpu"
 tokenizer = AutoTokenizer.from_pretrained("EleutherAI/gpt-neox-20b")
+model = MambaLMHeadModel.from_pretrained("state-spaces/mamba-2.8b", device=device, dtype=torch.float16)
 def pred(text_in, temperature, top_k, top_p, gen_length, cg, return_dict_in_generate, output_scores, enable_timing):
     tokens = tokenizer(text_in, return_tensors="pt")
     input_ids = tokens.input_ids.to(device=device)
+    attn_mask = tokens.attention_mask.to(device=device)
+    max_length = input_ids.shape[1] + genlen
     out = model.generate(
         input_ids=input_ids,
         max_length=max_length,