asifahmed
/

open_llama_7b_32K

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Asif Ahmad commited on Aug 11, 2023

Commit

b87bea2

•

1 Parent(s): 513a968

Update modeling_flash_llama.py

Files changed (1) hide show

modeling_flash_llama.py +1 -1

modeling_flash_llama.py CHANGED Viewed

@@ -68,7 +68,7 @@ def rmsnorm_func(hidden_states, weight, variance_epsilon):
     hidden_states = hidden_states.to(torch.float32)
     variance = hidden_states.pow(2).mean(-1, keepdim=True)
     hidden_states = hidden_states * torch.rsqrt(variance + variance_epsilon)
-    return weight * hidden_states.to(input_dtype)
 class LlamaRMSNorm(nn.Module):

     hidden_states = hidden_states.to(torch.float32)
     variance = hidden_states.pow(2).mean(-1, keepdim=True)
     hidden_states = hidden_states * torch.rsqrt(variance + variance_epsilon)
+    return (weight * hidden_states).to(input_dtype)
 class LlamaRMSNorm(nn.Module):