Spaces:

shikunl
/

prismer

Runtime error

App Files Files Community

shikunl commited on Mar 12, 2023

Commit

ad3ee60

•

1 Parent(s): 1dd8a60

Add label prettify

Browse files

Files changed (3) hide show

label_prettify.py +126 -0
prismer_model.py +3 -1
requirements.txt +1 -0

label_prettify.py ADDED Viewed

	@@ -0,0 +1,126 @@

+import glob
+import os
+import json
+import torch
+import random
+import matplotlib.pyplot as plt
+import matplotlib
+import numpy as np
+from prismer.utils import create_ade20k_label_colormap
+obj_label_map = torch.load('prismer/dataset/detection_features.pt')['labels']
+coco_label_map = torch.load('prismer/dataset/coco_features.pt')['labels']
+ade_color = create_ade20k_label_colormap()
+def islight(rgb):
+    r, g, b = rgb
+    hsp = np.sqrt(0.299 * (r * r) + 0.587 * (g * g) + 0.114 * (b * b))
+    if hsp > 127.5:
+        return True
+    else:
+        return False
+def depth_prettify(file_path):
+    depth = plt.imread(file_path)
+    plt.imsave(file_path, depth, cmap='rainbow')
+def obj_detection_prettify(rgb_path, path_name):
+    rgb = plt.imread(rgb_path)
+    obj_labels = plt.imread(path_name)
+    obj_labels_dict = json.load(open(path_name.replace('.png', '.json')))
+    plt.imshow(rgb)
+    num_objs = np.unique(obj_labels)[:-1].max()
+    plt.imshow(obj_labels, cmap='terrain', vmax=num_objs + 1 / 255., alpha=0.8)
+    cmap = matplotlib.colormaps.get_cmap('terrain')
+    for i in np.unique(obj_labels)[:-1]:
+        obj_idx_all = np.where(obj_labels == i)
+        x, y = obj_idx_all[1].mean(), obj_idx_all[0].mean()
+        obj_name = obj_label_map[obj_labels_dict[str(int(i * 255))]]
+        obj_name = obj_name.split(',')[0]
+        if islight([c*255 for c in cmap(i / num_objs)[:3]]):
+            plt.text(x, y, obj_name, c='black', horizontalalignment='center', verticalalignment='center', clip_on=True)
+        else:
+            plt.text(x, y, obj_name, c='white', horizontalalignment='center', verticalalignment='center', clip_on=True)
+    plt.axis('off')
+    plt.savefig(path_name, bbox_inches='tight', transparent=True, pad_inches=0)
+    plt.close()
+def seg_prettify(rgb_path, file_name):
+    rgb = plt.imread(rgb_path)
+    seg_labels = plt.imread(file_name)
+    plt.imshow(rgb)
+    seg_map = np.zeros(list(seg_labels.shape) + [3], dtype=np.int16)
+    for i in np.unique(seg_labels):
+        seg_map[seg_labels == i] = ade_color[int(i * 255)]
+    plt.imshow(seg_map, alpha=0.8)
+    for i in np.unique(seg_labels):
+        obj_idx_all = np.where(seg_labels == i)
+        x, y = obj_idx_all[1].mean(), obj_idx_all[0].mean()
+        obj_name = coco_label_map[int(i * 255)]
+        obj_name = obj_name.split(',')[0]
+        if islight(seg_map[int(y), int(x)]):
+            plt.text(x, y, obj_name, c='black', horizontalalignment='center', verticalalignment='center', clip_on=True)
+        else:
+            plt.text(x, y, obj_name, c='white', horizontalalignment='center', verticalalignment='center', clip_on=True)
+    plt.axis('off')
+    plt.savefig(file_name, bbox_inches='tight', transparent=True, pad_inches=0)
+    plt.close()
+def ocr_detection_prettify(rgb_path, file_name):
+    if os.path.exists(file_name):
+        rgb = plt.imread(rgb_path)
+        ocr_labels = plt.imread(file_name)
+        ocr_labels_dict = torch.load(file_name.replace('.png', '.pt'))
+        plt.imshow(rgb)
+        plt.imshow((1 - ocr_labels) < 1, cmap='gray', alpha=0.8)
+        for i in np.unique(ocr_labels)[:-1]:
+            text_idx_all = np.where(ocr_labels == i)
+            x, y = text_idx_all[1].mean(), text_idx_all[0].mean()
+            text = ocr_labels_dict[int(i * 255)]['text']
+            plt.text(x, y, text, c='white', horizontalalignment='center', verticalalignment='center', clip_on=True)
+        plt.axis('off')
+        plt.savefig(file_name, bbox_inches='tight', transparent=True, pad_inches=0)
+        plt.close()
+    else:
+        rgb = plt.imread(rgb_path)
+        ocr_labels = np.ones_like(rgb, dtype=np.float32())
+        plt.imshow(rgb)
+        plt.imshow(ocr_labels, cmap='gray', alpha=0.8)
+        x, y = rgb.shape[1] / 2, rgb.shape[0] / 2
+        plt.text(x, y, 'No text detected', c='black', horizontalalignment='center', verticalalignment='center', clip_on=True)
+        plt.axis('off')
+        plt.savefig(file_name, bbox_inches='tight', transparent=True, pad_inches=0)
+        plt.close()
+def label_prettify(rgb_path, expert_paths):
+    for expert_path in expert_paths:
+        if 'depth' in expert_path:
+            depth_prettify(expert_path)
+        elif 'seg' in expert_path:
+            seg_prettify(rgb_path, expert_path)
+        elif 'ocr' in expert_path:
+            ocr_detection_prettify(rgb_path, expert_path)
+        elif 'obj' in expert_path:
+            obj_detection_prettify(rgb_path, expert_path)

prismer_model.py CHANGED Viewed

@@ -9,6 +9,7 @@ import sys
 import cv2
 import torch
 repo_dir = pathlib.Path(__file__).parent
 submodule_dir = repo_dir / 'prismer'
@@ -53,7 +54,7 @@ def run_experts(image_path: str) -> tuple[str | None, ...]:
             env['PYTHONPATH'] = f'{submodule_dir.as_posix()}:{env["PYTHONPATH"]}'
         else:
             env['PYTHONPATH'] = submodule_dir.as_posix()
-        subprocess.run(shlex.split(f'accelerate experts/generate_{expert_name}.py'), cwd='prismer', env=env, check=True)
     keys = ['depth', 'edge', 'normal', 'seg_coco', 'obj_detection', 'ocr_detection']
     results = [pathlib.Path('prismer/helpers/labels') / key / 'helpers/images/image.png' for key in keys]
@@ -108,4 +109,5 @@ class Model:
     def run_caption(self, image_path: str, model_name: str) -> tuple[str | None, ...]:
         out_paths = run_experts(image_path)
         # caption = self.run_caption_model(model_name)
         return None, *out_paths

 import cv2
 import torch
+from label_prettify import label_prettify
 repo_dir = pathlib.Path(__file__).parent
 submodule_dir = repo_dir / 'prismer'
             env['PYTHONPATH'] = f'{submodule_dir.as_posix()}:{env["PYTHONPATH"]}'
         else:
             env['PYTHONPATH'] = submodule_dir.as_posix()
+        subprocess.run(shlex.split(f'python experts/generate_{expert_name}.py'), cwd='prismer', env=env, check=True)
     keys = ['depth', 'edge', 'normal', 'seg_coco', 'obj_detection', 'ocr_detection']
     results = [pathlib.Path('prismer/helpers/labels') / key / 'helpers/images/image.png' for key in keys]
     def run_caption(self, image_path: str, model_name: str) -> tuple[str | None, ...]:
         out_paths = run_experts(image_path)
         # caption = self.run_caption_model(model_name)
+        label_prettify(image_path, out_paths)
         return None, *out_paths

requirements.txt CHANGED Viewed

@@ -21,3 +21,4 @@ torch==1.13.1
 torchvision==0.14.1
 transformers==4.26.1
 yacs==0.1.8

 torchvision==0.14.1
 transformers==4.26.1
 yacs==0.1.8
+matplotlib=3.7.0