sachin
/

tiny_clip

Zero-Shot Image Classification

English

Model card Files Files and versions Community

sachin commited on Apr 14, 2024

Commit

180681d

1 Parent(s): 8dc3889

refactoring loss functions

Browse files

Files changed (1) hide show

src/loss.py +34 -10

src/loss.py CHANGED Viewed

@@ -3,6 +3,23 @@ from torch import nn
 import torch.nn.functional as F
 def contrastive_loss(logits, dim):
     neg_ce = torch.diag(F.log_softmax(logits, dim=dim))
     return -neg_ce.mean()
@@ -17,25 +34,29 @@ class CLIPLoss(nn.Module):
         super().__init__()
         self.logit_temperature = nn.Parameter(torch.tensor(logit_temperature))
-    def forward(self, image_features: torch.Tensor, text_features: torch.Tensor):
         temperature = self.logit_temperature.sigmoid()
-        similarity_matrix = image_features @ text_features.T
         caption_loss = contrastive_loss(similarity_matrix / temperature, dim=0)
         image_loss = contrastive_loss(similarity_matrix / temperature, dim=1)
         return 0.5 * (caption_loss + image_loss)
-class CyCLIP(nn.Module):
     def __init__(self, logit_temperature: float = -1.0):
         super().__init__()
         self.logit_temperature = nn.Parameter(torch.tensor(logit_temperature))
         self.lambda_1: float = 1.0
         self.lambda_2: float = 1.0
-    def forward(self, image_features: torch.Tensor, text_features: torch.Tensor):
         temperature = self.logit_temperature.sigmoid()
-        similarity_matrix = image_features @ text_features.T
         caption_loss = contrastive_loss(similarity_matrix / temperature, dim=0)
         image_loss = contrastive_loss(similarity_matrix / temperature, dim=1)
@@ -56,9 +77,8 @@ class SigLIPLoss(nn.Module):
         super().__init__()
         self.logit_temperature = nn.Parameter(torch.tensor(logit_temperature))
-    def forward(self, image_features: torch.Tensor, text_features: torch.Tensor):
         temperature = self.logit_temperature.sigmoid()
-        similarity_matrix = image_features @ text_features.T
         return contrastive_sigmoid_loss(similarity_matrix / temperature)
@@ -69,9 +89,13 @@ class CySigLIPLoss(nn.Module):
         self.lambda_1: float = 1.0
         self.lambda_2: float = 1.0
-    def forward(self, image_features: torch.Tensor, text_features: torch.Tensor):
         temperature = self.logit_temperature.sigmoid()
-        similarity_matrix = image_features @ text_features.T
         loss = contrastive_sigmoid_loss(similarity_matrix / temperature)
         symmetry_loss = F.mse_loss(similarity_matrix, similarity_matrix.T)
@@ -85,7 +109,7 @@ class CySigLIPLoss(nn.Module):
 def get_loss(loss_type: str):
     loss_functions = {
         "clip": CLIPLoss(),
-        "cyclip": CyCLIP(),
         "sigmoid": SigLIPLoss(),
         "cyclic_sigmoid": CySigLIPLoss(),
     }

 import torch.nn.functional as F
+def metrics(similarity: torch.Tensor) -> tuple[torch.Tensor, torch.Tensor]:
+    y = torch.arange(len(similarity)).to(similarity.device)
+    img2cap_match_idx = similarity.argmax(dim=1)
+    cap2img_match_idx = similarity.argmax(dim=0)
+    img_acc = (img2cap_match_idx == y).float().mean()
+    cap_acc = (cap2img_match_idx == y).float().mean()
+    return img_acc, cap_acc
+def get_similarity_matrix(
+    image_features: torch.Tensor, text_features: torch.Tensor
+) -> torch.Tensor:
+    return image_features @ text_features.T
 def contrastive_loss(logits, dim):
     neg_ce = torch.diag(F.log_softmax(logits, dim=dim))
     return -neg_ce.mean()
         super().__init__()
         self.logit_temperature = nn.Parameter(torch.tensor(logit_temperature))
+    def forward(self, similarity_matrix: torch.Tensor):
         temperature = self.logit_temperature.sigmoid()
         caption_loss = contrastive_loss(similarity_matrix / temperature, dim=0)
         image_loss = contrastive_loss(similarity_matrix / temperature, dim=1)
         return 0.5 * (caption_loss + image_loss)
+class CyCLIPLoss(nn.Module):
     def __init__(self, logit_temperature: float = -1.0):
         super().__init__()
         self.logit_temperature = nn.Parameter(torch.tensor(logit_temperature))
         self.lambda_1: float = 1.0
         self.lambda_2: float = 1.0
+    def forward(
+        self,
+        similarity_matrix: torch.Tensor,
+        image_features: torch.Tensor,
+        text_features: torch.Tensor,
+    ):
         temperature = self.logit_temperature.sigmoid()
         caption_loss = contrastive_loss(similarity_matrix / temperature, dim=0)
         image_loss = contrastive_loss(similarity_matrix / temperature, dim=1)
         super().__init__()
         self.logit_temperature = nn.Parameter(torch.tensor(logit_temperature))
+    def forward(self, similarity_matrix: torch.Tensor):
         temperature = self.logit_temperature.sigmoid()
         return contrastive_sigmoid_loss(similarity_matrix / temperature)
         self.lambda_1: float = 1.0
         self.lambda_2: float = 1.0
+    def forward(
+        self,
+        similarity_matrix: torch.Tensor,
+        image_features: torch.Tensor,
+        text_features: torch.Tensor,
+    ):
         temperature = self.logit_temperature.sigmoid()
         loss = contrastive_sigmoid_loss(similarity_matrix / temperature)
         symmetry_loss = F.mse_loss(similarity_matrix, similarity_matrix.T)
 def get_loss(loss_type: str):
     loss_functions = {
         "clip": CLIPLoss(),
+        "cyclip": CyCLIPLoss(),
         "sigmoid": SigLIPLoss(),
         "cyclic_sigmoid": CySigLIPLoss(),
     }