Spaces:

MoonQiu
/

FreeNoise

Sleeping

App Files Files Community

Anonymous commited on Nov 20, 2023

Commit

186fae0

•

1 Parent(s): a6fdb4d

add 512

Browse files

Files changed (5) hide show

app.py +26 -9
scripts/run_text2video_freenoise_256.sh +1 -1
scripts/run_text2video_freenoise_512.sh +1 -1
scripts/run_text2video_freenoise_mp_256.sh +1 -1
scripts/run_text2video_freenoise_mp_512.sh +1 -1

app.py CHANGED Viewed

@@ -17,22 +17,39 @@ from funcs import (
 )
 from utils.utils import instantiate_from_config
-ckpt_path_1024 = "checkpoints/base_1024_v1/model.ckpt"
-ckpt_dir_1024 = "checkpoints/base_1024_v1"
-os.makedirs(ckpt_dir_1024, exist_ok=True)
-hf_hub_download(repo_id="VideoCrafter/Text2Video-1024", filename="model.ckpt", local_dir=ckpt_dir_1024)
-# ckpt_path_256 = "checkpoints/base_256_v1/model.pth"
 # ckpt_dir_256 = "checkpoints/base_256_v1"
 # os.makedirs(ckpt_dir_256, exist_ok=True)
-# hf_hub_download(repo_id="MoonQiu/LongerCrafter", filename="model.pth", local_dir=ckpt_dir_256)
 def infer(prompt, output_size, seed, num_frames, ddim_steps, unconditional_guidance_scale, save_fps):
     window_size = 16
     window_stride = 4
-    if output_size == "576x1024":
         width = 1024
         height = 576
         config_1024 = "configs/inference_t2v_1024_v1.0_freenoise.yaml"
@@ -253,8 +270,8 @@ with gr.Blocks(css=css) as demo:
         with gr.Row():
             with gr.Accordion('FreeNoise Parameters (feel free to adjust these parameters based on your prompt): ', open=False):
                 with gr.Row():
-                    output_size = gr.Dropdown(["576x1024"], value="576x1024", label="Output Size (around 900s for 576x1024)")
-                    # output_size = gr.Dropdown(["576x1024", "256x256"], value="576x1024", label="Output Size", info="576x1024 is watermark-free")
                 with gr.Row():
                     num_frames = gr.Slider(label='Frames (a multiple of 4)',
                              minimum=16,

 )
 from utils.utils import instantiate_from_config
+ckpt_path_512 = "checkpoints/base_512_v1/model_512.ckpt"
+ckpt_dir_512 = "checkpoints/base_512_v1"
+os.makedirs(ckpt_dir_512, exist_ok=True)
+hf_hub_download(repo_id="MoonQiu/LongerCrafter", filename="model_512.ckpt", local_dir=ckpt_dir_512)
+# ckpt_path_1024 = "checkpoints/base_1024_v1/model.ckpt"
+# ckpt_dir_1024 = "checkpoints/base_1024_v1"
+# os.makedirs(ckpt_dir_1024, exist_ok=True)
+# hf_hub_download(repo_id="VideoCrafter/Text2Video-1024", filename="model.ckpt", local_dir=ckpt_dir_1024)
+# ckpt_path_256 = "checkpoints/base_256_v1/model_256.pth"
 # ckpt_dir_256 = "checkpoints/base_256_v1"
 # os.makedirs(ckpt_dir_256, exist_ok=True)
+# hf_hub_download(repo_id="MoonQiu/LongerCrafter", filename="model_256.pth", local_dir=ckpt_dir_256)
 def infer(prompt, output_size, seed, num_frames, ddim_steps, unconditional_guidance_scale, save_fps):
     window_size = 16
     window_stride = 4
+    if output_size == "320x512":
+        width = 512
+        height = 320
+        config_512 = "configs/inference_t2v_tconv512_v1.0_freenoise.yaml"
+        config_512 = OmegaConf.load(config_512)
+        model_config_512 = config_512.pop("model", OmegaConf.create())
+        model_512 = instantiate_from_config(model_config_512)
+        model_512 = model_512.cuda()
+        model_512 = load_model_checkpoint(model_512, ckpt_path_512)
+        model_512.eval()
+        model = model_512
+        fps = 8
+    elif output_size == "576x1024":
         width = 1024
         height = 576
         config_1024 = "configs/inference_t2v_1024_v1.0_freenoise.yaml"
         with gr.Row():
             with gr.Accordion('FreeNoise Parameters (feel free to adjust these parameters based on your prompt): ', open=False):
                 with gr.Row():
+                    # output_size = gr.Dropdown(["576x1024"], value="576x1024", label="Output Size (around 900s for 576x1024)")
+                    output_size = gr.Dropdown(["320x512", "576x1024"], value="320x512", label="Output Size", info="576x1024 will cost around 900s")
                 with gr.Row():
                     num_frames = gr.Slider(label='Frames (a multiple of 4)',
                              minimum=16,

scripts/run_text2video_freenoise_256.sh CHANGED Viewed

@@ -1,6 +1,6 @@
 name="base_256_test"
-ckpt='checkpoints/base_256_v1/model.pth'
 config='configs/inference_t2v_tconv256_v1.0_freenoise.yaml'
 prompt_file="prompts/single_prompts.txt"

 name="base_256_test"
+ckpt='checkpoints/base_256_v1/model_256.pth'
 config='configs/inference_t2v_tconv256_v1.0_freenoise.yaml'
 prompt_file="prompts/single_prompts.txt"

scripts/run_text2video_freenoise_512.sh CHANGED Viewed

@@ -1,6 +1,6 @@
 name="base_512_test"
-ckpt='checkpoints/base_512_v1/model.ckpt'
 config='configs/inference_t2v_tconv512_v1.0_freenoise.yaml'
 prompt_file="prompts/single_prompts.txt"

 name="base_512_test"
+ckpt='checkpoints/base_512_v1/model_512.ckpt'
 config='configs/inference_t2v_tconv512_v1.0_freenoise.yaml'
 prompt_file="prompts/single_prompts.txt"

scripts/run_text2video_freenoise_mp_256.sh CHANGED Viewed

@@ -1,6 +1,6 @@
 name="base_256_test"
-ckpt='checkpoints/base_256_v1/model.pth'
 config='configs/inference_t2v_tconv256_v1.0_freenoise.yaml'
 prompt_file="prompts/mp_prompts.txt"

 name="base_256_test"
+ckpt='checkpoints/base_256_v1/model_256.pth'
 config='configs/inference_t2v_tconv256_v1.0_freenoise.yaml'
 prompt_file="prompts/mp_prompts.txt"

scripts/run_text2video_freenoise_mp_512.sh CHANGED Viewed

@@ -1,6 +1,6 @@
 name="base_512_test"
-ckpt='checkpoints/base_512_v1/model.ckpt'
 config='configs/inference_t2v_tconv512_v1.0_freenoise.yaml'
 prompt_file="prompts/mp_prompts.txt"

 name="base_512_test"
+ckpt='checkpoints/base_512_v1/model_512.ckpt'
 config='configs/inference_t2v_tconv512_v1.0_freenoise.yaml'
 prompt_file="prompts/mp_prompts.txt"