t-tech
/

flex-sae

elephantmipt commited on Sep 29

Commit

8f19e61

verified ·

1 Parent(s): a38f7ad

Upload folder using huggingface_hub

Files changed (1) hide show

README.md CHANGED Viewed

@@ -33,7 +33,7 @@ hierarchical_top_k_kernel = flex.triton_hierarchical_sae_loss
 "B -- batch size, K -- top-k, F -- dictionary size, D -- model hidden dim"
 loss: torch.Tensor = top_k_kernel(
-      indices: torch.Tensor,  # [B, K]
     weight: torch.Tensor,  # [F, D]
     vals: torch.Tensor,  # [B, K]
     bias: torch.Tensor,  # [D]
@@ -41,7 +41,7 @@ loss: torch.Tensor = top_k_kernel(
 )
 loss: torch.Tensor = hierarchical_top_k_kernel(
-      indices: torch.Tensor,  # [B, K]
     weight: torch.Tensor,  # [F, D]
     vals: torch.Tensor,  # [B, K]
     bias: torch.Tensor,  # [D]

 "B -- batch size, K -- top-k, F -- dictionary size, D -- model hidden dim"
 loss: torch.Tensor = top_k_kernel(
+    indices: torch.Tensor,  # [B, K]
     weight: torch.Tensor,  # [F, D]
     vals: torch.Tensor,  # [B, K]
     bias: torch.Tensor,  # [D]
 )
 loss: torch.Tensor = hierarchical_top_k_kernel(
+    indices: torch.Tensor,  # [B, K]
     weight: torch.Tensor,  # [F, D]
     vals: torch.Tensor,  # [B, K]
     bias: torch.Tensor,  # [D]