Spaces:

Doubiiu
/

ViewCrafter

Running on Zero

Drexubery commited on Sep 10

Commit

600dfac

•

1 Parent(s): ec0c93a

update

Files changed (2) hide show

utils/pvd_utils.py CHANGED Viewed

@@ -32,6 +32,7 @@ sys.path.append('./extern/dust3r')
 from dust3r.utils.device import to_numpy
 import matplotlib.pyplot as plt
 import matplotlib.colors as mcolors
 def save_video(data,images_path,folder=None):
     if isinstance(data, np.ndarray):
@@ -521,3 +522,30 @@ def visualizer_frame(camera_poses, highlight_index):
     return img

 from dust3r.utils.device import to_numpy
 import matplotlib.pyplot as plt
 import matplotlib.colors as mcolors
+from torchvision.transforms import CenterCrop, Compose, Resize
 def save_video(data,images_path,folder=None):
     if isinstance(data, np.ndarray):
     return img
+def center_crop_image(input_image):
+    height = 576
+    width = 1024
+    _,_,h,w = input_image.shape
+    h_ratio = h / height
+    w_ratio = w / width
+    if h_ratio > w_ratio:
+        h = int(h / w_ratio)
+        if h < height:
+            h = height
+        input_image = Resize((h, width))(input_image)
+    else:
+        w = int(w / h_ratio)
+        if w < width:
+            w = width
+        input_image = Resize((height, w))(input_image)
+    transformer = Compose([
+        # Resize(width),
+        CenterCrop((height, width)),
+    ])
+    input_image = transformer(input_image)
+    return input_image

viewcrafter.py CHANGED Viewed

@@ -401,14 +401,10 @@ class ViewCrafter:
         self.opts.center_scale = float(i2v_center_scale)
         i2v_d_phi,i2v_d_theta,i2v_d_r = [i for i in i2v_pose.split(';')]
         self.gradio_traj = [float(i) for i in i2v_d_phi.split()],[float(i) for i in i2v_d_theta.split()],[float(i) for i in i2v_d_r.split()]
-        transform = transforms.Compose([
-            transforms.Resize((576,1024)),
-            # transforms.CenterCrop((576,1024)),
-            ])
         torch.cuda.empty_cache()
         img_tensor = torch.from_numpy(i2v_input_image).permute(2, 0, 1).unsqueeze(0).float().to(self.device)
         img_tensor = (img_tensor / 255. - 0.5) * 2
-        image_tensor_resized = transform(img_tensor) #1,3,h,w
         images = get_input_dict(image_tensor_resized,idx = 0,dtype = torch.float32)
         images = [images, copy.deepcopy(images)]
         images[1]['idx'] = 1

         self.opts.center_scale = float(i2v_center_scale)
         i2v_d_phi,i2v_d_theta,i2v_d_r = [i for i in i2v_pose.split(';')]
         self.gradio_traj = [float(i) for i in i2v_d_phi.split()],[float(i) for i in i2v_d_theta.split()],[float(i) for i in i2v_d_r.split()]
         torch.cuda.empty_cache()
         img_tensor = torch.from_numpy(i2v_input_image).permute(2, 0, 1).unsqueeze(0).float().to(self.device)
         img_tensor = (img_tensor / 255. - 0.5) * 2
+        image_tensor_resized = center_crop_image(img_tensor) #1,3,h,w
         images = get_input_dict(image_tensor_resized,idx = 0,dtype = torch.float32)
         images = [images, copy.deepcopy(images)]
         images[1]['idx'] = 1