mamba

Running on T4

reach-vb HF Staff commited on Dec 21, 2023

Commit

2292c41

1 Parent(s): 9a94062

Update app.py (#2)

Files changed (1) hide show

app.py CHANGED Viewed

@@ -10,8 +10,8 @@ from mamba_ssm.models.mixer_seq_simple import MambaLMHeadModel
 device = "cuda"
 tokenizer = AutoTokenizer.from_pretrained("EleutherAI/gpt-neox-20b")
-model = MambaLMHeadModel.from_pretrained("state-spaces/mamba-2.8b", device=device, dtype=torch.float16)
-genlen = 200
 def pred(text_in,):
     tokens = tokenizer(text_in, return_tensors="pt")
@@ -25,8 +25,7 @@ def pred(text_in,):
         return_dict_in_generate=True,
         output_scores=True,
         enable_timing=False,
-        temperature=0.5,
-        top_k=10,
         top_p=0.9,
     )
     out = fn()

 device = "cuda"
 tokenizer = AutoTokenizer.from_pretrained("EleutherAI/gpt-neox-20b")
+model = MambaLMHeadModel.from_pretrained("state-spaces/mamba-2.8b-slimpj", device=device, dtype=torch.float16)
+genlen = 500
 def pred(text_in,):
     tokens = tokenizer(text_in, return_tensors="pt")
         return_dict_in_generate=True,
         output_scores=True,
         enable_timing=False,
+        temperature=0.7,
         top_p=0.9,
     )
     out = fn()