Spaces:

marlenezw
/

audio-driven-animations

Sleeping

App Files Files Community

marlenezw commited on Feb 16, 2023

Commit

075b64e

•

1 Parent(s): 45f7432

editing a bunch of file paths.

Browse files

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

MakeItTalk/animated.py +19 -19
MakeItTalk/examples/dump/random_val_au.pickle +2 -2
MakeItTalk/examples/dump/random_val_fl.pickle +2 -2
MakeItTalk/examples/in_audio.wav +0 -0
MakeItTalk/examples/in_audio_av.mp4 +0 -0
MakeItTalk/examples/in_image.jpg +0 -0
MakeItTalk/examples/in_image_pred_fls_in_audio_audio_embed.mp4 +0 -0
MakeItTalk/main_end2end.py +18 -18
MakeItTalk/main_end2end_cartoon.py +26 -26
MakeItTalk/main_gen_new_puppet.py +1 -1
MakeItTalk/marlene_test.ipynb +18 -18
MakeItTalk/quick_demo.ipynb +18 -18
MakeItTalk/quick_demo_tdlr.ipynb +19 -19
MakeItTalk/src/__pycache__/__init__.cpython-37.pyc +0 -0
MakeItTalk/src/approaches/__pycache__/__init__.cpython-37.pyc +0 -0
MakeItTalk/src/approaches/__pycache__/train_audio2landmark.cpython-37.pyc +0 -0
MakeItTalk/src/approaches/__pycache__/train_image_translation.cpython-37.pyc +0 -0
MakeItTalk/src/approaches/train_audio2landmark.py +4 -4
MakeItTalk/src/approaches/train_content.py +2 -2
MakeItTalk/src/approaches/train_noautovc.py +1 -1
MakeItTalk/src/approaches/train_speaker_aware.py +1 -1
MakeItTalk/src/autovc/AutoVC_mel_Convertor_retrain_version.py +1 -1
MakeItTalk/src/autovc/__pycache__/AutoVC_mel_Convertor_retrain_version.cpython-37.pyc +0 -0
MakeItTalk/src/autovc/__pycache__/__init__.cpython-37.pyc +0 -0
MakeItTalk/src/autovc/__pycache__/utils.cpython-37.pyc +0 -0
MakeItTalk/src/autovc/retrain_version/__pycache__/__init__.cpython-37.pyc +0 -0
MakeItTalk/src/autovc/retrain_version/__pycache__/model_vc_37_1.cpython-37.pyc +0 -0
MakeItTalk/src/autovc/retrain_version/vocoder_spec/__pycache__/__init__.cpython-37.pyc +0 -0
MakeItTalk/src/autovc/retrain_version/vocoder_spec/__pycache__/extract_f0_func.cpython-37.pyc +0 -0
MakeItTalk/src/autovc/retrain_version/vocoder_spec/__pycache__/utils.cpython-37.pyc +0 -0
MakeItTalk/src/dataset/__pycache__/__init__.cpython-37.pyc +0 -0
MakeItTalk/src/dataset/audio2landmark/__pycache__/__init__.cpython-37.pyc +0 -0
MakeItTalk/src/dataset/audio2landmark/__pycache__/audio2landmark_dataset.cpython-37.pyc +0 -0
MakeItTalk/src/dataset/audio2landmark/audio2landmark_dataset.py +2 -2
MakeItTalk/src/dataset/image_translation/__pycache__/__init__.cpython-37.pyc +0 -0
MakeItTalk/src/dataset/image_translation/__pycache__/data_preparation.cpython-37.pyc +0 -0
MakeItTalk/src/dataset/image_translation/__pycache__/image_translation_dataset.cpython-37.pyc +0 -0
MakeItTalk/src/dataset/utils/__pycache__/Av2Flau_Convertor.cpython-37.pyc +0 -0
MakeItTalk/src/dataset/utils/__pycache__/__init__.cpython-37.pyc +0 -0
MakeItTalk/src/dataset/utils/__pycache__/icp.cpython-37.pyc +0 -0
MakeItTalk/src/models/__pycache__/__init__.cpython-37.pyc +0 -0
MakeItTalk/src/models/__pycache__/model_audio2landmark.cpython-37.pyc +0 -0
MakeItTalk/src/models/__pycache__/model_image_translation.cpython-37.pyc +0 -0
MakeItTalk/test.ipynb +19 -19
MakeItTalk/thirdparty/AdaptiveWingLoss/.gitignore +0 -8
MakeItTalk/thirdparty/AdaptiveWingLoss/__pycache__/__init__.cpython-37.pyc +0 -0
MakeItTalk/thirdparty/AdaptiveWingLoss/__pycache__/__init__.cpython-39.pyc +0 -0
MakeItTalk/thirdparty/AdaptiveWingLoss/ckpt/.gitkeep +0 -0
MakeItTalk/thirdparty/AdaptiveWingLoss/core/__pycache__/__init__.cpython-37.pyc +0 -0
MakeItTalk/thirdparty/AdaptiveWingLoss/core/__pycache__/__init__.cpython-39.pyc +0 -0

MakeItTalk/animated.py CHANGED Viewed

@@ -15,7 +15,7 @@ import ipywidgets as widgets
 import glob
 import matplotlib.pyplot as plt
 print("Choose the image name to animate: (saved in folder 'MakeItTalk/examples/')")
-img_list = glob.glob1('examples', '*.jpg')
 img_list.sort()
 img_list = [item.split('.')[0] for item in img_list]
 default_head_name = widgets.Dropdown(options=img_list, value='marlene_v2')
@@ -97,7 +97,7 @@ parser.add_argument('--amp_pos', type=float, default=AMP_HEAD_POSE_MOTION)
 parser.add_argument('--reuse_train_emb_list', type=str, nargs='+', default=[]) #  ['iWeklsXc0H8']) #['45hn7-LXDX8']) #['E_kmpT-EfOg']) #'iWeklsXc0H8', '29k8RtSUjE0', '45hn7-LXDX8',
 parser.add_argument('--add_audio_in', default=False, action='store_true')
 parser.add_argument('--comb_fan_awing', default=False, action='store_true')
-parser.add_argument('--output_folder', type=str, default='examples')
 parser.add_argument('--test_end2end', default=True, action='store_true')
 parser.add_argument('--dump_dir', type=str, default='', help='')
 parser.add_argument('--pos_dim', default=7, type=int)
@@ -148,7 +148,7 @@ print("Loaded Image...", file=sys.stderr)
 # %%
 au_data = []
 au_emb = []
-ains = glob.glob1('examples', '*.wav')
 ains = [item for item in ains if item != 'tmp.wav']
 ains.sort()
 for ain in ains:
@@ -161,9 +161,9 @@ for ain in ains:
     au_emb.append(me.reshape(-1))
     print('Processing audio file', ain)
-    c = AutoVC_mel_Convertor('examples')
-    au_data_i = c.convert_single_wav_to_autovc_input(audio_filename=os.path.join('examples', ain),
            autovc_model_path=opt_parser.load_AUTOVC_name)
     au_data += au_data_i
 if(os.path.isfile('MakeItTalk/examples/tmp.wav')):
@@ -185,20 +185,20 @@ for au, info in au_data:
     rot_quat.append(np.zeros(shape=(au_length, 4)))
     anchor_t_shape.append(np.zeros(shape=(au_length, 68 * 3)))
-if(os.path.exists(os.path.join('examples', 'dump', 'random_val_fl.pickle'))):
-    os.remove(os.path.join('examples', 'dump', 'random_val_fl.pickle'))
-if(os.path.exists(os.path.join('examples', 'dump', 'random_val_fl_interp.pickle'))):
-    os.remove(os.path.join('examples', 'dump', 'random_val_fl_interp.pickle'))
-if(os.path.exists(os.path.join('examples', 'dump', 'random_val_au.pickle'))):
-    os.remove(os.path.join('examples', 'dump', 'random_val_au.pickle'))
-if (os.path.exists(os.path.join('examples', 'dump', 'random_val_gaze.pickle'))):
-    os.remove(os.path.join('examples', 'dump', 'random_val_gaze.pickle'))
-with open(os.path.join('examples', 'dump', 'random_val_fl.pickle'), 'wb') as fp:
     pickle.dump(fl_data, fp)
-with open(os.path.join('examples', 'dump', 'random_val_au.pickle'), 'wb') as fp:
     pickle.dump(au_data, fp)
-with open(os.path.join('examples', 'dump', 'random_val_gaze.pickle'), 'wb') as fp:
     gaze = {'rot_trans':rot_tran, 'rot_quat':rot_quat, 'anchor_t_shape':anchor_t_shape}
     pickle.dump(gaze, fp)
@@ -214,11 +214,11 @@ print("Audio->Landmark...", file=sys.stderr)
 # %%
-fls = glob.glob1('examples', 'pred_fls_*.txt')
 fls.sort()
 for i in range(0,len(fls)):
-    fl = np.loadtxt(os.path.join('examples', fls[i])).reshape((-1, 68,3))
     print(fls[i])
     fl[:, :, 0:2] = -fl[:, :, 0:2]
     fl[:, :, 0:2] = fl[:, :, 0:2] / scale - shift
@@ -237,7 +237,7 @@ for i in range(0,len(fls)):
     with torch.no_grad():
         model.single_test(jpg=img, fls=fl, filename=fls[i], prefix=opt_parser.jpg.split('.')[0])
         print('finish image2image gen')
-    os.remove(os.path.join('examples', fls[i]))
     print("{} / {}: Landmark->Face...".format(i+1, len(fls)), file=sys.stderr)
 print("Done!", file=sys.stderr)

 import glob
 import matplotlib.pyplot as plt
 print("Choose the image name to animate: (saved in folder 'MakeItTalk/examples/')")
+img_list = glob.glob1('MakeItTalk/examples', '*.jpg')
 img_list.sort()
 img_list = [item.split('.')[0] for item in img_list]
 default_head_name = widgets.Dropdown(options=img_list, value='marlene_v2')
 parser.add_argument('--reuse_train_emb_list', type=str, nargs='+', default=[]) #  ['iWeklsXc0H8']) #['45hn7-LXDX8']) #['E_kmpT-EfOg']) #'iWeklsXc0H8', '29k8RtSUjE0', '45hn7-LXDX8',
 parser.add_argument('--add_audio_in', default=False, action='store_true')
 parser.add_argument('--comb_fan_awing', default=False, action='store_true')
+parser.add_argument('--output_folder', type=str, default='MakeItTalk/examples')
 parser.add_argument('--test_end2end', default=True, action='store_true')
 parser.add_argument('--dump_dir', type=str, default='', help='')
 parser.add_argument('--pos_dim', default=7, type=int)
 # %%
 au_data = []
 au_emb = []
+ains = glob.glob1('MakeItTalk/examples', '*.wav')
 ains = [item for item in ains if item != 'tmp.wav']
 ains.sort()
 for ain in ains:
     au_emb.append(me.reshape(-1))
     print('Processing audio file', ain)
+    c = AutoVC_mel_Convertor('MakeItTalk/examples')
+    au_data_i = c.convert_single_wav_to_autovc_input(audio_filename=os.path.join('MakeItTalk/examples', ain),
            autovc_model_path=opt_parser.load_AUTOVC_name)
     au_data += au_data_i
 if(os.path.isfile('MakeItTalk/examples/tmp.wav')):
     rot_quat.append(np.zeros(shape=(au_length, 4)))
     anchor_t_shape.append(np.zeros(shape=(au_length, 68 * 3)))
+if(os.path.exists(os.path.join('MakeItTalk/examples', 'dump', 'random_val_fl.pickle'))):
+    os.remove(os.path.join('MakeItTalk/examples', 'dump', 'random_val_fl.pickle'))
+if(os.path.exists(os.path.join('MakeItTalk/examples', 'dump', 'random_val_fl_interp.pickle'))):
+    os.remove(os.path.join('MakeItTalk/examples', 'dump', 'random_val_fl_interp.pickle'))
+if(os.path.exists(os.path.join('MakeItTalk/examples', 'dump', 'random_val_au.pickle'))):
+    os.remove(os.path.join('MakeItTalk/examples', 'dump', 'random_val_au.pickle'))
+if (os.path.exists(os.path.join('MakeItTalk/examples', 'dump', 'random_val_gaze.pickle'))):
+    os.remove(os.path.join('MakeItTalk/examples', 'dump', 'random_val_gaze.pickle'))
+with open(os.path.join('MakeItTalk/examples', 'dump', 'random_val_fl.pickle'), 'wb') as fp:
     pickle.dump(fl_data, fp)
+with open(os.path.join('MakeItTalk/examples', 'dump', 'random_val_au.pickle'), 'wb') as fp:
     pickle.dump(au_data, fp)
+with open(os.path.join('MakeItTalk/examples', 'dump', 'random_val_gaze.pickle'), 'wb') as fp:
     gaze = {'rot_trans':rot_tran, 'rot_quat':rot_quat, 'anchor_t_shape':anchor_t_shape}
     pickle.dump(gaze, fp)
 # %%
+fls = glob.glob1('MakeItTalk/examples', 'pred_fls_*.txt')
 fls.sort()
 for i in range(0,len(fls)):
+    fl = np.loadtxt(os.path.join('MakeItTalk/examples', fls[i])).reshape((-1, 68,3))
     print(fls[i])
     fl[:, :, 0:2] = -fl[:, :, 0:2]
     fl[:, :, 0:2] = fl[:, :, 0:2] / scale - shift
     with torch.no_grad():
         model.single_test(jpg=img, fls=fl, filename=fls[i], prefix=opt_parser.jpg.split('.')[0])
         print('finish image2image gen')
+    os.remove(os.path.join('MakeItTalk/examples', fls[i]))
     print("{} / {}: Landmark->Face...".format(i+1, len(fls)), file=sys.stderr)
 print("Done!", file=sys.stderr)

MakeItTalk/examples/dump/random_val_au.pickle CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c5d7bc5f8a663c93e5a670e0a17724a1feec755bfef26db3b88af411bf02a436
-size 98863

 version https://git-lfs.github.com/spec/v1
+oid sha256:c067bc38f69311b87902146eb9c42f4dd06d123980b22b9476848e5451cacecf
+size 98874

MakeItTalk/examples/dump/random_val_fl.pickle CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c50cd350875447ec841ac54e7fe4537a0ce750fb8b2f385aaab244841b86cbd5
-size 499064

 version https://git-lfs.github.com/spec/v1
+oid sha256:c5f8aad8e9a4165ee354c96000afac730a1c01cdcbe5ca93b005e203cc3ce85c
+size 499075

MakeItTalk/examples/in_audio.wav ADDED Viewed

Binary file (156 kB). View file

MakeItTalk/examples/in_audio_av.mp4 ADDED Viewed

Binary file (242 kB). View file

MakeItTalk/examples/in_image.jpg CHANGED Viewed

MakeItTalk/examples/in_image_pred_fls_in_audio_audio_embed.mp4 ADDED Viewed

Binary file (132 kB). View file

MakeItTalk/main_end2end.py CHANGED Viewed

@@ -45,7 +45,7 @@ parser.add_argument('--amp_pos', type=float, default=.5)
 parser.add_argument('--reuse_train_emb_list', type=str, nargs='+', default=[]) #  ['iWeklsXc0H8']) #['45hn7-LXDX8']) #['E_kmpT-EfOg']) #'iWeklsXc0H8', '29k8RtSUjE0', '45hn7-LXDX8',
 parser.add_argument('--add_audio_in', default=False, action='store_true')
 parser.add_argument('--comb_fan_awing', default=False, action='store_true')
-parser.add_argument('--output_folder', type=str, default='examples')
 parser.add_argument('--test_end2end', default=True, action='store_true')
 parser.add_argument('--dump_dir', type=str, default='', help='')
@@ -95,7 +95,7 @@ shape_3d, scale, shift = util.norm_input_face(shape_3d)
 # audio real data
 au_data = []
 au_emb = []
-ains = glob.glob1('examples', '*.wav')
 ains = [item for item in ains if item != 'tmp.wav']
 ains.sort()
 for ain in ains:
@@ -108,9 +108,9 @@ for ain in ains:
     au_emb.append(me.reshape(-1))
     print('Processing audio file', ain)
-    c = AutoVC_mel_Convertor('examples')
-    au_data_i = c.convert_single_wav_to_autovc_input(audio_filename=os.path.join('examples', ain),
            autovc_model_path=opt_parser.load_AUTOVC_name)
     au_data += au_data_i
 if(os.path.isfile('MakeItTalk/examples/tmp.wav')):
@@ -127,20 +127,20 @@ for au, info in au_data:
     rot_quat.append(np.zeros(shape=(au_length, 4)))
     anchor_t_shape.append(np.zeros(shape=(au_length, 68 * 3)))
-if(os.path.exists(os.path.join('examples', 'dump', 'random_val_fl.pickle'))):
-    os.remove(os.path.join('examples', 'dump', 'random_val_fl.pickle'))
-if(os.path.exists(os.path.join('examples', 'dump', 'random_val_fl_interp.pickle'))):
-    os.remove(os.path.join('examples', 'dump', 'random_val_fl_interp.pickle'))
-if(os.path.exists(os.path.join('examples', 'dump', 'random_val_au.pickle'))):
-    os.remove(os.path.join('examples', 'dump', 'random_val_au.pickle'))
-if (os.path.exists(os.path.join('examples', 'dump', 'random_val_gaze.pickle'))):
-    os.remove(os.path.join('examples', 'dump', 'random_val_gaze.pickle'))
-with open(os.path.join('examples', 'dump', 'random_val_fl.pickle'), 'wb') as fp:
     pickle.dump(fl_data, fp)
-with open(os.path.join('examples', 'dump', 'random_val_au.pickle'), 'wb') as fp:
     pickle.dump(au_data, fp)
-with open(os.path.join('examples', 'dump', 'random_val_gaze.pickle'), 'wb') as fp:
     gaze = {'rot_trans':rot_tran, 'rot_quat':rot_quat, 'anchor_t_shape':anchor_t_shape}
     pickle.dump(gaze, fp)
@@ -154,11 +154,11 @@ else:
 ''' STEP 5: de-normalize the output to the original image scale '''
-fls = glob.glob1('examples', 'pred_fls_*.txt') #it looks like fls is the name of our desired output video but as a group of numpy arrays in a txt file
 fls.sort()
 for i in range(0,len(fls)):
-    fl = np.loadtxt(os.path.join('examples', fls[i])).reshape((-1, 68,3)) #this is our desired image loaded into numpy ndarray. Data read from the text file.
     fl[:, :, 0:2] = -fl[:, :, 0:2] #i think this is adjusting the color
     fl[:, :, 0:2] = fl[:, :, 0:2] / scale - shift #an ndarray image array is (H, W, D) i.e. (height, width, depth), so we are adjusting depth here
@@ -176,4 +176,4 @@ for i in range(0,len(fls)):
     with torch.no_grad():
         model.single_test(jpg=img, fls=fl, filename=fls[i], prefix=opt_parser.jpg.split('.')[0]) #fls is the video we want
         print('finish image2image gen')
-    os.remove(os.path.join('examples', fls[i]))

 parser.add_argument('--reuse_train_emb_list', type=str, nargs='+', default=[]) #  ['iWeklsXc0H8']) #['45hn7-LXDX8']) #['E_kmpT-EfOg']) #'iWeklsXc0H8', '29k8RtSUjE0', '45hn7-LXDX8',
 parser.add_argument('--add_audio_in', default=False, action='store_true')
 parser.add_argument('--comb_fan_awing', default=False, action='store_true')
+parser.add_argument('--output_folder', type=str, default='MakeItTalk/examples')
 parser.add_argument('--test_end2end', default=True, action='store_true')
 parser.add_argument('--dump_dir', type=str, default='', help='')
 # audio real data
 au_data = []
 au_emb = []
+ains = glob.glob1('MakeItTalk/examples', '*.wav')
 ains = [item for item in ains if item != 'tmp.wav']
 ains.sort()
 for ain in ains:
     au_emb.append(me.reshape(-1))
     print('Processing audio file', ain)
+    c = AutoVC_mel_Convertor('MakeItTalk/examples')
+    au_data_i = c.convert_single_wav_to_autovc_input(audio_filename=os.path.join('MakeItTalk/examples', ain),
            autovc_model_path=opt_parser.load_AUTOVC_name)
     au_data += au_data_i
 if(os.path.isfile('MakeItTalk/examples/tmp.wav')):
     rot_quat.append(np.zeros(shape=(au_length, 4)))
     anchor_t_shape.append(np.zeros(shape=(au_length, 68 * 3)))
+if(os.path.exists(os.path.join('MakeItTalk/examples', 'dump', 'random_val_fl.pickle'))):
+    os.remove(os.path.join('MakeItTalk/examples', 'dump', 'random_val_fl.pickle'))
+if(os.path.exists(os.path.join('MakeItTalk/examples', 'dump', 'random_val_fl_interp.pickle'))):
+    os.remove(os.path.join('MakeItTalk/examples', 'dump', 'random_val_fl_interp.pickle'))
+if(os.path.exists(os.path.join('MakeItTalk/examples', 'dump', 'random_val_au.pickle'))):
+    os.remove(os.path.join('MakeItTalk/examples', 'dump', 'random_val_au.pickle'))
+if (os.path.exists(os.path.join('MakeItTalk/examples', 'dump', 'random_val_gaze.pickle'))):
+    os.remove(os.path.join('MakeItTalk/examples', 'dump', 'random_val_gaze.pickle'))
+with open(os.path.join('MakeItTalk/examples', 'dump', 'random_val_fl.pickle'), 'wb') as fp:
     pickle.dump(fl_data, fp)
+with open(os.path.join('MakeItTalk/examples', 'dump', 'random_val_au.pickle'), 'wb') as fp:
     pickle.dump(au_data, fp)
+with open(os.path.join('MakeItTalk/examples', 'dump', 'random_val_gaze.pickle'), 'wb') as fp:
     gaze = {'rot_trans':rot_tran, 'rot_quat':rot_quat, 'anchor_t_shape':anchor_t_shape}
     pickle.dump(gaze, fp)
 ''' STEP 5: de-normalize the output to the original image scale '''
+fls = glob.glob1('MakeItTalk/examples', 'pred_fls_*.txt') #it looks like fls is the name of our desired output video but as a group of numpy arrays in a txt file
 fls.sort()
 for i in range(0,len(fls)):
+    fl = np.loadtxt(os.path.join('MakeItTalk/examples', fls[i])).reshape((-1, 68,3)) #this is our desired image loaded into numpy ndarray. Data read from the text file.
     fl[:, :, 0:2] = -fl[:, :, 0:2] #i think this is adjusting the color
     fl[:, :, 0:2] = fl[:, :, 0:2] / scale - shift #an ndarray image array is (H, W, D) i.e. (height, width, depth), so we are adjusting depth here
     with torch.no_grad():
         model.single_test(jpg=img, fls=fl, filename=fls[i], prefix=opt_parser.jpg.split('.')[0]) #fls is the video we want
         print('finish image2image gen')
+    os.remove(os.path.join('MakeItTalk/examples', fls[i]))

MakeItTalk/main_end2end_cartoon.py CHANGED Viewed

@@ -43,7 +43,7 @@ parser.add_argument('--reuse_train_emb_list', type=str, nargs='+', default=[]) #
 parser.add_argument('--add_audio_in', default=False, action='store_true')
 parser.add_argument('--comb_fan_awing', default=False, action='store_true')
-parser.add_argument('--output_folder', type=str, default='examples_cartoon')
 #### NEW POSE MODEL
 parser.add_argument('--test_end2end', default=True, action='store_true')
@@ -68,12 +68,12 @@ opt_parser = parser.parse_args()
 DEMO_CH = opt_parser.jpg.split('.')[0]
-shape_3d = np.loadtxt('examples_cartoon/{}_face_close_mouth.txt'.format(DEMO_CH))
 ''' STEP 3: Generate audio data as input to audio branch '''
 au_data = []
 au_emb = []
-ains = glob.glob1('examples', '*.wav')
 ains = [item for item in ains if item is not 'tmp.wav']
 ains.sort()
 for ain in ains:
@@ -86,11 +86,11 @@ for ain in ains:
     au_emb.append(me.reshape(-1))
     print('Processing audio file', ain)
-    c = AutoVC_mel_Convertor('examples')
-    au_data_i = c.convert_single_wav_to_autovc_input(audio_filename=os.path.join('examples', ain),
            autovc_model_path=opt_parser.load_AUTOVC_name)
     au_data += au_data_i
-    # os.remove(os.path.join('examples', 'tmp.wav'))
 if(os.path.isfile('MakeItTalk/examples/tmp.wav')):
     os.remove('MakeItTalk/examples/tmp.wav')
@@ -104,20 +104,20 @@ for au, info in au_data:
     rot_quat.append(np.zeros(shape=(au_length, 4)))
     anchor_t_shape.append(np.zeros(shape=(au_length, 68 * 3)))
-if(os.path.exists(os.path.join('examples', 'dump', 'random_val_fl.pickle'))):
-    os.remove(os.path.join('examples', 'dump', 'random_val_fl.pickle'))
-if(os.path.exists(os.path.join('examples', 'dump', 'random_val_fl_interp.pickle'))):
-    os.remove(os.path.join('examples', 'dump', 'random_val_fl_interp.pickle'))
-if(os.path.exists(os.path.join('examples', 'dump', 'random_val_au.pickle'))):
-    os.remove(os.path.join('examples', 'dump', 'random_val_au.pickle'))
-if (os.path.exists(os.path.join('examples', 'dump', 'random_val_gaze.pickle'))):
-    os.remove(os.path.join('examples', 'dump', 'random_val_gaze.pickle'))
-with open(os.path.join('examples', 'dump', 'random_val_fl.pickle'), 'wb') as fp:
     pickle.dump(fl_data, fp)
-with open(os.path.join('examples', 'dump', 'random_val_au.pickle'), 'wb') as fp:
     pickle.dump(au_data, fp)
-with open(os.path.join('examples', 'dump', 'random_val_gaze.pickle'), 'wb') as fp:
     gaze = {'rot_trans':rot_tran, 'rot_quat':rot_quat, 'anchor_t_shape':anchor_t_shape}
     pickle.dump(gaze, fp)
@@ -132,15 +132,15 @@ else:
 print('finish gen fls')
 ''' STEP 5: de-normalize the output to the original image scale '''
-fls_names = glob.glob1('examples_cartoon', 'pred_fls_*.txt')
 fls_names.sort()
 for i in range(0,len(fls_names)):
-    ains = glob.glob1('examples', '*.wav')
     ains.sort()
     ain = ains[i]
-    fl = np.loadtxt(os.path.join('examples_cartoon', fls_names[i])).reshape((-1, 68,3))
-    output_dir = os.path.join('examples_cartoon', fls_names[i][:-4])
     try:
         os.makedirs(output_dir)
     except:
@@ -148,7 +148,7 @@ for i in range(0,len(fls_names)):
     from util.utils import get_puppet_info
-    bound, scale, shift = get_puppet_info(DEMO_CH, ROOT_DIR='examples_cartoon')
     fls = fl.reshape((-1, 68, 3))
@@ -182,16 +182,16 @@ for i in range(0,len(fls_names)):
     np.savetxt(os.path.join(output_dir, 'warped_points.txt'), fls, fmt='%.2f')
     # static_points.txt
-    static_frame = np.loadtxt(os.path.join('examples_cartoon', '{}_face_open_mouth.txt'.format(DEMO_CH)))
     static_frame = static_frame[r, 0:2]
     static_frame = np.concatenate((static_frame, bound.reshape(-1, 2)), axis=0)
     np.savetxt(os.path.join(output_dir, 'reference_points.txt'), static_frame, fmt='%.2f')
     # triangle_vtx_index.txt
-    shutil.copy(os.path.join('examples_cartoon', DEMO_CH + '_delauney_tri.txt'),
                 os.path.join(output_dir, 'triangulation.txt'))
-    os.remove(os.path.join('examples_cartoon', fls_names[i]))
     # ==============================================
     # Step 4 : Vector art morphing
@@ -227,6 +227,6 @@ for i in range(0,len(fls_names)):
             os.path.join(cur_dir, '..', '..', opt_parser.jpg_bg),
             '-novsync -dump'))
     os.system('ffmpeg -y -r 62.5 -f image2 -i "%06d.tga" -i {} -pix_fmt yuv420p -vf "pad=ceil(iw/2)*2:ceil(ih/2)*2" -shortest -strict -2 {}'.format(
-        os.path.join(cur_dir, '..', '..', '..', 'examples', ain),
         os.path.join(cur_dir, '..', 'out.mp4')
     ))

 parser.add_argument('--add_audio_in', default=False, action='store_true')
 parser.add_argument('--comb_fan_awing', default=False, action='store_true')
+parser.add_argument('--output_folder', type=str, default='MakeItTalk/examples_cartoon')
 #### NEW POSE MODEL
 parser.add_argument('--test_end2end', default=True, action='store_true')
 DEMO_CH = opt_parser.jpg.split('.')[0]
+shape_3d = np.loadtxt('MakeItTalk/examples_cartoon/{}_face_close_mouth.txt'.format(DEMO_CH))
 ''' STEP 3: Generate audio data as input to audio branch '''
 au_data = []
 au_emb = []
+ains = glob.glob1('MakeItTalk/examples', '*.wav')
 ains = [item for item in ains if item is not 'tmp.wav']
 ains.sort()
 for ain in ains:
     au_emb.append(me.reshape(-1))
     print('Processing audio file', ain)
+    c = AutoVC_mel_Convertor('MakeItTalk/examples')
+    au_data_i = c.convert_single_wav_to_autovc_input(audio_filename=os.path.join('MakeItTalk/examples', ain),
            autovc_model_path=opt_parser.load_AUTOVC_name)
     au_data += au_data_i
+    # os.remove(os.path.join('MakeItTalk/examples', 'tmp.wav'))
 if(os.path.isfile('MakeItTalk/examples/tmp.wav')):
     os.remove('MakeItTalk/examples/tmp.wav')
     rot_quat.append(np.zeros(shape=(au_length, 4)))
     anchor_t_shape.append(np.zeros(shape=(au_length, 68 * 3)))
+if(os.path.exists(os.path.join('MakeItTalk/examples', 'dump', 'random_val_fl.pickle'))):
+    os.remove(os.path.join('MakeItTalk/examples', 'dump', 'random_val_fl.pickle'))
+if(os.path.exists(os.path.join('MakeItTalk/examples', 'dump', 'random_val_fl_interp.pickle'))):
+    os.remove(os.path.join('MakeItTalk/examples', 'dump', 'random_val_fl_interp.pickle'))
+if(os.path.exists(os.path.join('MakeItTalk/examples', 'dump', 'random_val_au.pickle'))):
+    os.remove(os.path.join('MakeItTalk/examples', 'dump', 'random_val_au.pickle'))
+if (os.path.exists(os.path.join('MakeItTalk/examples', 'dump', 'random_val_gaze.pickle'))):
+    os.remove(os.path.join('MakeItTalk/examples', 'dump', 'random_val_gaze.pickle'))
+with open(os.path.join('MakeItTalk/examples', 'dump', 'random_val_fl.pickle'), 'wb') as fp:
     pickle.dump(fl_data, fp)
+with open(os.path.join('MakeItTalk/examples', 'dump', 'random_val_au.pickle'), 'wb') as fp:
     pickle.dump(au_data, fp)
+with open(os.path.join('MakeItTalk/examples', 'dump', 'random_val_gaze.pickle'), 'wb') as fp:
     gaze = {'rot_trans':rot_tran, 'rot_quat':rot_quat, 'anchor_t_shape':anchor_t_shape}
     pickle.dump(gaze, fp)
 print('finish gen fls')
 ''' STEP 5: de-normalize the output to the original image scale '''
+fls_names = glob.glob1('MakeItTalk/examples_cartoon', 'pred_fls_*.txt')
 fls_names.sort()
 for i in range(0,len(fls_names)):
+    ains = glob.glob1('MakeItTalk/examples', '*.wav')
     ains.sort()
     ain = ains[i]
+    fl = np.loadtxt(os.path.join('MakeItTalk/examples_cartoon', fls_names[i])).reshape((-1, 68,3))
+    output_dir = os.path.join('MakeItTalk/examples_cartoon', fls_names[i][:-4])
     try:
         os.makedirs(output_dir)
     except:
     from util.utils import get_puppet_info
+    bound, scale, shift = get_puppet_info(DEMO_CH, ROOT_DIR='MakeItTalk/examples_cartoon')
     fls = fl.reshape((-1, 68, 3))
     np.savetxt(os.path.join(output_dir, 'warped_points.txt'), fls, fmt='%.2f')
     # static_points.txt
+    static_frame = np.loadtxt(os.path.join('MakeItTalk/examples_cartoon', '{}_face_open_mouth.txt'.format(DEMO_CH)))
     static_frame = static_frame[r, 0:2]
     static_frame = np.concatenate((static_frame, bound.reshape(-1, 2)), axis=0)
     np.savetxt(os.path.join(output_dir, 'reference_points.txt'), static_frame, fmt='%.2f')
     # triangle_vtx_index.txt
+    shutil.copy(os.path.join('MakeItTalk/examples_cartoon', DEMO_CH + '_delauney_tri.txt'),
                 os.path.join(output_dir, 'triangulation.txt'))
+    os.remove(os.path.join('MakeItTalk/examples_cartoon', fls_names[i]))
     # ==============================================
     # Step 4 : Vector art morphing
             os.path.join(cur_dir, '..', '..', opt_parser.jpg_bg),
             '-novsync -dump'))
     os.system('ffmpeg -y -r 62.5 -f image2 -i "%06d.tga" -i {} -pix_fmt yuv420p -vf "pad=ceil(iw/2)*2:ceil(ih/2)*2" -shortest -strict -2 {}'.format(
+        os.path.join(cur_dir, '..', '..', '..', 'MakeItTalk/examples', ain),
         os.path.join(cur_dir, '..', 'out.mp4')
     ))

MakeItTalk/main_gen_new_puppet.py CHANGED Viewed

@@ -5,7 +5,7 @@ from facewarp.gen_puppet_utils import *
             FOA face landmark detection
 ================================================ '''
-data_dir = out_dir = 'examples_cartoon'
 test_data = sys.argv[1] # for example 'roy_example.png'
 CH = test_data[:-4]
 use_gt_bb = False

             FOA face landmark detection
 ================================================ '''
+data_dir = out_dir = 'MakeItTalk/examples_cartoon'
 test_data = sys.argv[1] # for example 'roy_example.png'
 CH = test_data[:-4]
 use_gt_bb = False

MakeItTalk/marlene_test.ipynb CHANGED Viewed

@@ -61,7 +61,7 @@
    "source": [
     "\n",
     "# print(\"Choose the image name to animate: (saved in folder 'MakeItTalk/examples/')\")\n",
-    "# img_list = glob.glob1('examples', '*.jpg')\n",
     "# img_list.sort()\n",
     "# img_list = [item.split('.')[0] for item in img_list]\n",
     "# default_head_name = widgets.Dropdown(options=img_list, value='marlene_v2')\n",
@@ -136,7 +136,7 @@
     "parser.add_argument('--reuse_train_emb_list', type=str, nargs='+', default=[]) #  ['iWeklsXc0H8']) #['45hn7-LXDX8']) #['E_kmpT-EfOg']) #'iWeklsXc0H8', '29k8RtSUjE0', '45hn7-LXDX8',\n",
     "parser.add_argument('--add_audio_in', default=False, action='store_true')\n",
     "parser.add_argument('--comb_fan_awing', default=False, action='store_true')\n",
-    "parser.add_argument('--output_folder', type=str, default='examples')\n",
     "parser.add_argument('--test_end2end', default=True, action='store_true')\n",
     "parser.add_argument('--dump_dir', type=str, default='', help='')\n",
     "parser.add_argument('--pos_dim', default=7, type=int)\n",
@@ -259,7 +259,7 @@
     "#now we want to load the audio file \n",
     "# au_data = []\n",
     "# au_emb = []\n",
-    "# ains = glob.glob1('examples', '*.wav')\n",
     "# ains = [item for item in ains if item != 'tmp.wav']\n",
     "# ains.sort()\n",
     "\n",
@@ -274,7 +274,7 @@
     "me, ae = get_spk_emb(f'MakeItTalk/examples/{input_audio}')\n",
     "au_emb.append(me.reshape(-1))\n",
     "\n",
-    "c = AutoVC_mel_Convertor('examples')\n",
     "\n",
     "au_data_i = c.convert_single_wav_to_autovc_input(audio_filename=input_audio, autovc_model_path=opt_parser.load_AUTOVC_name)\n",
     "\n",
@@ -302,20 +302,20 @@
     "    rot_quat.append(np.zeros(shape=(au_length, 4)))\n",
     "    anchor_t_shape.append(np.zeros(shape=(au_length, 68 * 3)))\n",
     "\n",
-    "if(os.path.exists(os.path.join('examples', 'dump', 'random_val_fl.pickle'))):\n",
-    "    os.remove(os.path.join('examples', 'dump', 'random_val_fl.pickle'))\n",
-    "if(os.path.exists(os.path.join('examples', 'dump', 'random_val_fl_interp.pickle'))):\n",
-    "    os.remove(os.path.join('examples', 'dump', 'random_val_fl_interp.pickle'))\n",
-    "if(os.path.exists(os.path.join('examples', 'dump', 'random_val_au.pickle'))):\n",
-    "    os.remove(os.path.join('examples', 'dump', 'random_val_au.pickle'))\n",
-    "if (os.path.exists(os.path.join('examples', 'dump', 'random_val_gaze.pickle'))):\n",
-    "    os.remove(os.path.join('examples', 'dump', 'random_val_gaze.pickle'))\n",
     "\n",
-    "with open(os.path.join('examples', 'dump', 'random_val_fl.pickle'), 'wb') as fp:\n",
     "    pickle.dump(fl_data, fp)\n",
-    "with open(os.path.join('examples', 'dump', 'random_val_au.pickle'), 'wb') as fp:\n",
     "    pickle.dump(au_data, fp)\n",
-    "with open(os.path.join('examples', 'dump', 'random_val_gaze.pickle'), 'wb') as fp:\n",
     "    gaze = {'rot_trans':rot_tran, 'rot_quat':rot_quat, 'anchor_t_shape':anchor_t_shape}\n",
     "    pickle.dump(gaze, fp)"
    ]
@@ -435,11 +435,11 @@
     }
    ],
    "source": [
-    "fls = glob.glob1('examples', 'pred_fls_*.txt')\n",
     "fls.sort()\n",
     "\n",
     "for i in range(0,len(fls)):\n",
-    "    fl = np.loadtxt(os.path.join('examples', fls[i])).reshape((-1, 68,3))\n",
     "    print(fls[i])\n",
     "    fl[:, :, 0:2] = -fl[:, :, 0:2]\n",
     "    fl[:, :, 0:2] = fl[:, :, 0:2] / scale - shift\n",
@@ -458,7 +458,7 @@
     "    with torch.no_grad():\n",
     "        model.single_test(jpg=img, fls=fl, filename=fls[i], prefix=opt_parser.jpg.split('.')[0])\n",
     "        print('finish image2image gen')\n",
-    "    os.remove(os.path.join('examples', fls[i]))\n",
     "\n",
     "    print(\"{} / {}: Landmark->Face...\".format(i+1, len(fls)), file=sys.stderr)\n",
     "print(\"Done!\", file=sys.stderr)"

    "source": [
     "\n",
     "# print(\"Choose the image name to animate: (saved in folder 'MakeItTalk/examples/')\")\n",
+    "# img_list = glob.glob1('MakeItTalk/examples', '*.jpg')\n",
     "# img_list.sort()\n",
     "# img_list = [item.split('.')[0] for item in img_list]\n",
     "# default_head_name = widgets.Dropdown(options=img_list, value='marlene_v2')\n",
     "parser.add_argument('--reuse_train_emb_list', type=str, nargs='+', default=[]) #  ['iWeklsXc0H8']) #['45hn7-LXDX8']) #['E_kmpT-EfOg']) #'iWeklsXc0H8', '29k8RtSUjE0', '45hn7-LXDX8',\n",
     "parser.add_argument('--add_audio_in', default=False, action='store_true')\n",
     "parser.add_argument('--comb_fan_awing', default=False, action='store_true')\n",
+    "parser.add_argument('--output_folder', type=str, default='MakeItTalk/examples')\n",
     "parser.add_argument('--test_end2end', default=True, action='store_true')\n",
     "parser.add_argument('--dump_dir', type=str, default='', help='')\n",
     "parser.add_argument('--pos_dim', default=7, type=int)\n",
     "#now we want to load the audio file \n",
     "# au_data = []\n",
     "# au_emb = []\n",
+    "# ains = glob.glob1('MakeItTalk/examples', '*.wav')\n",
     "# ains = [item for item in ains if item != 'tmp.wav']\n",
     "# ains.sort()\n",
     "\n",
     "me, ae = get_spk_emb(f'MakeItTalk/examples/{input_audio}')\n",
     "au_emb.append(me.reshape(-1))\n",
     "\n",
+    "c = AutoVC_mel_Convertor('MakeItTalk/examples')\n",
     "\n",
     "au_data_i = c.convert_single_wav_to_autovc_input(audio_filename=input_audio, autovc_model_path=opt_parser.load_AUTOVC_name)\n",
     "\n",
     "    rot_quat.append(np.zeros(shape=(au_length, 4)))\n",
     "    anchor_t_shape.append(np.zeros(shape=(au_length, 68 * 3)))\n",
     "\n",
+    "if(os.path.exists(os.path.join('MakeItTalk/examples', 'dump', 'random_val_fl.pickle'))):\n",
+    "    os.remove(os.path.join('MakeItTalk/examples', 'dump', 'random_val_fl.pickle'))\n",
+    "if(os.path.exists(os.path.join('MakeItTalk/examples', 'dump', 'random_val_fl_interp.pickle'))):\n",
+    "    os.remove(os.path.join('MakeItTalk/examples', 'dump', 'random_val_fl_interp.pickle'))\n",
+    "if(os.path.exists(os.path.join('MakeItTalk/examples', 'dump', 'random_val_au.pickle'))):\n",
+    "    os.remove(os.path.join('MakeItTalk/examples', 'dump', 'random_val_au.pickle'))\n",
+    "if (os.path.exists(os.path.join('MakeItTalk/examples', 'dump', 'random_val_gaze.pickle'))):\n",
+    "    os.remove(os.path.join('MakeItTalk/examples', 'dump', 'random_val_gaze.pickle'))\n",
     "\n",
+    "with open(os.path.join('MakeItTalk/examples', 'dump', 'random_val_fl.pickle'), 'wb') as fp:\n",
     "    pickle.dump(fl_data, fp)\n",
+    "with open(os.path.join('MakeItTalk/examples', 'dump', 'random_val_au.pickle'), 'wb') as fp:\n",
     "    pickle.dump(au_data, fp)\n",
+    "with open(os.path.join('MakeItTalk/examples', 'dump', 'random_val_gaze.pickle'), 'wb') as fp:\n",
     "    gaze = {'rot_trans':rot_tran, 'rot_quat':rot_quat, 'anchor_t_shape':anchor_t_shape}\n",
     "    pickle.dump(gaze, fp)"
    ]
     }
    ],
    "source": [
+    "fls = glob.glob1('MakeItTalk/examples', 'pred_fls_*.txt')\n",
     "fls.sort()\n",
     "\n",
     "for i in range(0,len(fls)):\n",
+    "    fl = np.loadtxt(os.path.join('MakeItTalk/examples', fls[i])).reshape((-1, 68,3))\n",
     "    print(fls[i])\n",
     "    fl[:, :, 0:2] = -fl[:, :, 0:2]\n",
     "    fl[:, :, 0:2] = fl[:, :, 0:2] / scale - shift\n",
     "    with torch.no_grad():\n",
     "        model.single_test(jpg=img, fls=fl, filename=fls[i], prefix=opt_parser.jpg.split('.')[0])\n",
     "        print('finish image2image gen')\n",
+    "    os.remove(os.path.join('MakeItTalk/examples', fls[i]))\n",
     "\n",
     "    print(\"{} / {}: Landmark->Face...\".format(i+1, len(fls)), file=sys.stderr)\n",
     "print(\"Done!\", file=sys.stderr)"

MakeItTalk/quick_demo.ipynb CHANGED Viewed

@@ -414,7 +414,7 @@
         "parser.add_argument('--reuse_train_emb_list', type=str, nargs='+', default=[]) #  ['iWeklsXc0H8']) #['45hn7-LXDX8']) #['E_kmpT-EfOg']) #'iWeklsXc0H8', '29k8RtSUjE0', '45hn7-LXDX8',\n",
         "parser.add_argument('--add_audio_in', default=False, action='store_true')\n",
         "parser.add_argument('--comb_fan_awing', default=False, action='store_true')\n",
-        "parser.add_argument('--output_folder', type=str, default='examples')\n",
         "\n",
         "parser.add_argument('--test_end2end', default=True, action='store_true')\n",
         "parser.add_argument('--dump_dir', type=str, default='', help='')\n",
@@ -536,7 +536,7 @@
       "source": [
         "au_data = []\n",
         "au_emb = []\n",
-        "ains = glob.glob1('examples', '*.wav')\n",
         "ains = [item for item in ains if item is not 'tmp.wav']\n",
         "ains.sort()\n",
         "for ain in ains:\n",
@@ -549,9 +549,9 @@
         "    au_emb.append(me.reshape(-1))\n",
         "\n",
         "    print('Processing audio file', ain)\n",
-        "    c = AutoVC_mel_Convertor('examples')\n",
         "\n",
-        "    au_data_i = c.convert_single_wav_to_autovc_input(audio_filename=os.path.join('examples', ain),\n",
         "           autovc_model_path=opt_parser.load_AUTOVC_name)\n",
         "    au_data += au_data_i\n",
         "if(os.path.isfile('MakeItTalk/examples/tmp.wav')):\n",
@@ -568,20 +568,20 @@
         "    rot_quat.append(np.zeros(shape=(au_length, 4)))\n",
         "    anchor_t_shape.append(np.zeros(shape=(au_length, 68 * 3)))\n",
         "\n",
-        "if(os.path.exists(os.path.join('examples', 'dump', 'random_val_fl.pickle'))):\n",
-        "    os.remove(os.path.join('examples', 'dump', 'random_val_fl.pickle'))\n",
-        "if(os.path.exists(os.path.join('examples', 'dump', 'random_val_fl_interp.pickle'))):\n",
-        "    os.remove(os.path.join('examples', 'dump', 'random_val_fl_interp.pickle'))\n",
-        "if(os.path.exists(os.path.join('examples', 'dump', 'random_val_au.pickle'))):\n",
-        "    os.remove(os.path.join('examples', 'dump', 'random_val_au.pickle'))\n",
-        "if (os.path.exists(os.path.join('examples', 'dump', 'random_val_gaze.pickle'))):\n",
-        "    os.remove(os.path.join('examples', 'dump', 'random_val_gaze.pickle'))\n",
         "\n",
-        "with open(os.path.join('examples', 'dump', 'random_val_fl.pickle'), 'wb') as fp:\n",
         "    pickle.dump(fl_data, fp)\n",
-        "with open(os.path.join('examples', 'dump', 'random_val_au.pickle'), 'wb') as fp:\n",
         "    pickle.dump(au_data, fp)\n",
-        "with open(os.path.join('examples', 'dump', 'random_val_gaze.pickle'), 'wb') as fp:\n",
         "    gaze = {'rot_trans':rot_tran, 'rot_quat':rot_quat, 'anchor_t_shape':anchor_t_shape}\n",
         "    pickle.dump(gaze, fp)"
       ],
@@ -747,11 +747,11 @@
         }
       },
       "source": [
-        "fls = glob.glob1('examples', 'pred_fls_*.txt')\n",
         "fls.sort()\n",
         "\n",
         "for i in range(0,len(fls)):\n",
-        "    fl = np.loadtxt(os.path.join('examples', fls[i])).reshape((-1, 68,3))\n",
         "    fl[:, :, 0:2] = -fl[:, :, 0:2]\n",
         "    fl[:, :, 0:2] = fl[:, :, 0:2] / scale - shift\n",
         "\n",
@@ -769,7 +769,7 @@
         "    with torch.no_grad():\n",
         "        model.single_test(jpg=img, fls=fl, filename=fls[i], prefix=opt_parser.jpg.split('.')[0])\n",
         "        print('finish image2image gen')\n",
-        "    os.remove(os.path.join('examples', fls[i]))"
       ],
       "execution_count": null,
       "outputs": [

         "parser.add_argument('--reuse_train_emb_list', type=str, nargs='+', default=[]) #  ['iWeklsXc0H8']) #['45hn7-LXDX8']) #['E_kmpT-EfOg']) #'iWeklsXc0H8', '29k8RtSUjE0', '45hn7-LXDX8',\n",
         "parser.add_argument('--add_audio_in', default=False, action='store_true')\n",
         "parser.add_argument('--comb_fan_awing', default=False, action='store_true')\n",
+        "parser.add_argument('--output_folder', type=str, default='MakeItTalk/examples')\n",
         "\n",
         "parser.add_argument('--test_end2end', default=True, action='store_true')\n",
         "parser.add_argument('--dump_dir', type=str, default='', help='')\n",
       "source": [
         "au_data = []\n",
         "au_emb = []\n",
+        "ains = glob.glob1('MakeItTalk/examples', '*.wav')\n",
         "ains = [item for item in ains if item is not 'tmp.wav']\n",
         "ains.sort()\n",
         "for ain in ains:\n",
         "    au_emb.append(me.reshape(-1))\n",
         "\n",
         "    print('Processing audio file', ain)\n",
+        "    c = AutoVC_mel_Convertor('MakeItTalk/examples')\n",
         "\n",
+        "    au_data_i = c.convert_single_wav_to_autovc_input(audio_filename=os.path.join('MakeItTalk/examples', ain),\n",
         "           autovc_model_path=opt_parser.load_AUTOVC_name)\n",
         "    au_data += au_data_i\n",
         "if(os.path.isfile('MakeItTalk/examples/tmp.wav')):\n",
         "    rot_quat.append(np.zeros(shape=(au_length, 4)))\n",
         "    anchor_t_shape.append(np.zeros(shape=(au_length, 68 * 3)))\n",
         "\n",
+        "if(os.path.exists(os.path.join('MakeItTalk/examples', 'dump', 'random_val_fl.pickle'))):\n",
+        "    os.remove(os.path.join('MakeItTalk/examples', 'dump', 'random_val_fl.pickle'))\n",
+        "if(os.path.exists(os.path.join('MakeItTalk/examples', 'dump', 'random_val_fl_interp.pickle'))):\n",
+        "    os.remove(os.path.join('MakeItTalk/examples', 'dump', 'random_val_fl_interp.pickle'))\n",
+        "if(os.path.exists(os.path.join('MakeItTalk/examples', 'dump', 'random_val_au.pickle'))):\n",
+        "    os.remove(os.path.join('MakeItTalk/examples', 'dump', 'random_val_au.pickle'))\n",
+        "if (os.path.exists(os.path.join('MakeItTalk/examples', 'dump', 'random_val_gaze.pickle'))):\n",
+        "    os.remove(os.path.join('MakeItTalk/examples', 'dump', 'random_val_gaze.pickle'))\n",
         "\n",
+        "with open(os.path.join('MakeItTalk/examples', 'dump', 'random_val_fl.pickle'), 'wb') as fp:\n",
         "    pickle.dump(fl_data, fp)\n",
+        "with open(os.path.join('MakeItTalk/examples', 'dump', 'random_val_au.pickle'), 'wb') as fp:\n",
         "    pickle.dump(au_data, fp)\n",
+        "with open(os.path.join('MakeItTalk/examples', 'dump', 'random_val_gaze.pickle'), 'wb') as fp:\n",
         "    gaze = {'rot_trans':rot_tran, 'rot_quat':rot_quat, 'anchor_t_shape':anchor_t_shape}\n",
         "    pickle.dump(gaze, fp)"
       ],
         }
       },
       "source": [
+        "fls = glob.glob1('MakeItTalk/examples', 'pred_fls_*.txt')\n",
         "fls.sort()\n",
         "\n",
         "for i in range(0,len(fls)):\n",
+        "    fl = np.loadtxt(os.path.join('MakeItTalk/examples', fls[i])).reshape((-1, 68,3))\n",
         "    fl[:, :, 0:2] = -fl[:, :, 0:2]\n",
         "    fl[:, :, 0:2] = fl[:, :, 0:2] / scale - shift\n",
         "\n",
         "    with torch.no_grad():\n",
         "        model.single_test(jpg=img, fls=fl, filename=fls[i], prefix=opt_parser.jpg.split('.')[0])\n",
         "        print('finish image2image gen')\n",
+        "    os.remove(os.path.join('MakeItTalk/examples', fls[i]))"
       ],
       "execution_count": null,
       "outputs": [

MakeItTalk/quick_demo_tdlr.ipynb CHANGED Viewed

@@ -187,7 +187,7 @@
         "import glob\n",
         "import matplotlib.pyplot as plt\n",
         "print(\"Choose the image name to animate: (saved in folder 'MakeItTalk/examples/')\")\n",
-        "img_list = glob.glob1('examples', '*.jpg')\n",
         "img_list.sort()\n",
         "img_list = [item.split('.')[0] for item in img_list]\n",
         "default_head_name = widgets.Dropdown(options=img_list, value='paint_boy')\n",
@@ -316,7 +316,7 @@
         "parser.add_argument('--reuse_train_emb_list', type=str, nargs='+', default=[]) #  ['iWeklsXc0H8']) #['45hn7-LXDX8']) #['E_kmpT-EfOg']) #'iWeklsXc0H8', '29k8RtSUjE0', '45hn7-LXDX8',\n",
         "parser.add_argument('--add_audio_in', default=False, action='store_true')\n",
         "parser.add_argument('--comb_fan_awing', default=False, action='store_true')\n",
-        "parser.add_argument('--output_folder', type=str, default='examples')\n",
         "parser.add_argument('--test_end2end', default=True, action='store_true')\n",
         "parser.add_argument('--dump_dir', type=str, default='', help='')\n",
         "parser.add_argument('--pos_dim', default=7, type=int)\n",
@@ -356,7 +356,7 @@
         "\n",
         "au_data = []\n",
         "au_emb = []\n",
-        "ains = glob.glob1('examples', '*.wav')\n",
         "ains = [item for item in ains if item is not 'tmp.wav']\n",
         "ains.sort()\n",
         "for ain in ains:\n",
@@ -369,9 +369,9 @@
         "    au_emb.append(me.reshape(-1))\n",
         "\n",
         "    print('Processing audio file', ain)\n",
-        "    c = AutoVC_mel_Convertor('examples')\n",
         "\n",
-        "    au_data_i = c.convert_single_wav_to_autovc_input(audio_filename=os.path.join('examples', ain),\n",
         "           autovc_model_path=opt_parser.load_AUTOVC_name)\n",
         "    au_data += au_data_i\n",
         "if(os.path.isfile('MakeItTalk/examples/tmp.wav')):\n",
@@ -390,20 +390,20 @@
         "    rot_quat.append(np.zeros(shape=(au_length, 4)))\n",
         "    anchor_t_shape.append(np.zeros(shape=(au_length, 68 * 3)))\n",
         "\n",
-        "if(os.path.exists(os.path.join('examples', 'dump', 'random_val_fl.pickle'))):\n",
-        "    os.remove(os.path.join('examples', 'dump', 'random_val_fl.pickle'))\n",
-        "if(os.path.exists(os.path.join('examples', 'dump', 'random_val_fl_interp.pickle'))):\n",
-        "    os.remove(os.path.join('examples', 'dump', 'random_val_fl_interp.pickle'))\n",
-        "if(os.path.exists(os.path.join('examples', 'dump', 'random_val_au.pickle'))):\n",
-        "    os.remove(os.path.join('examples', 'dump', 'random_val_au.pickle'))\n",
-        "if (os.path.exists(os.path.join('examples', 'dump', 'random_val_gaze.pickle'))):\n",
-        "    os.remove(os.path.join('examples', 'dump', 'random_val_gaze.pickle'))\n",
         "\n",
-        "with open(os.path.join('examples', 'dump', 'random_val_fl.pickle'), 'wb') as fp:\n",
         "    pickle.dump(fl_data, fp)\n",
-        "with open(os.path.join('examples', 'dump', 'random_val_au.pickle'), 'wb') as fp:\n",
         "    pickle.dump(au_data, fp)\n",
-        "with open(os.path.join('examples', 'dump', 'random_val_gaze.pickle'), 'wb') as fp:\n",
         "    gaze = {'rot_trans':rot_tran, 'rot_quat':rot_quat, 'anchor_t_shape':anchor_t_shape}\n",
         "    pickle.dump(gaze, fp)\n",
         "\n",
@@ -415,11 +415,11 @@
         "\n",
         "print(\"Audio->Landmark...\", file=sys.stderr)\n",
         "\n",
-        "fls = glob.glob1('examples', 'pred_fls_*.txt')\n",
         "fls.sort()\n",
         "\n",
         "for i in range(0,len(fls)):\n",
-        "    fl = np.loadtxt(os.path.join('examples', fls[i])).reshape((-1, 68,3))\n",
         "    fl[:, :, 0:2] = -fl[:, :, 0:2]\n",
         "    fl[:, :, 0:2] = fl[:, :, 0:2] / scale - shift\n",
         "\n",
@@ -437,7 +437,7 @@
         "    with torch.no_grad():\n",
         "        model.single_test(jpg=img, fls=fl, filename=fls[i], prefix=opt_parser.jpg.split('.')[0])\n",
         "        print('finish image2image gen')\n",
-        "    os.remove(os.path.join('examples', fls[i]))\n",
         "\n",
         "    print(\"{} / {}: Landmark->Face...\".format(i+1, len(fls)), file=sys.stderr)\n",
         "print(\"Done!\", file=sys.stderr)"

         "import glob\n",
         "import matplotlib.pyplot as plt\n",
         "print(\"Choose the image name to animate: (saved in folder 'MakeItTalk/examples/')\")\n",
+        "img_list = glob.glob1('MakeItTalk/examples', '*.jpg')\n",
         "img_list.sort()\n",
         "img_list = [item.split('.')[0] for item in img_list]\n",
         "default_head_name = widgets.Dropdown(options=img_list, value='paint_boy')\n",
         "parser.add_argument('--reuse_train_emb_list', type=str, nargs='+', default=[]) #  ['iWeklsXc0H8']) #['45hn7-LXDX8']) #['E_kmpT-EfOg']) #'iWeklsXc0H8', '29k8RtSUjE0', '45hn7-LXDX8',\n",
         "parser.add_argument('--add_audio_in', default=False, action='store_true')\n",
         "parser.add_argument('--comb_fan_awing', default=False, action='store_true')\n",
+        "parser.add_argument('--output_folder', type=str, default='MakeItTalk/examples')\n",
         "parser.add_argument('--test_end2end', default=True, action='store_true')\n",
         "parser.add_argument('--dump_dir', type=str, default='', help='')\n",
         "parser.add_argument('--pos_dim', default=7, type=int)\n",
         "\n",
         "au_data = []\n",
         "au_emb = []\n",
+        "ains = glob.glob1('MakeItTalk/examples', '*.wav')\n",
         "ains = [item for item in ains if item is not 'tmp.wav']\n",
         "ains.sort()\n",
         "for ain in ains:\n",
         "    au_emb.append(me.reshape(-1))\n",
         "\n",
         "    print('Processing audio file', ain)\n",
+        "    c = AutoVC_mel_Convertor('MakeItTalk/examples')\n",
         "\n",
+        "    au_data_i = c.convert_single_wav_to_autovc_input(audio_filename=os.path.join('MakeItTalk/examples', ain),\n",
         "           autovc_model_path=opt_parser.load_AUTOVC_name)\n",
         "    au_data += au_data_i\n",
         "if(os.path.isfile('MakeItTalk/examples/tmp.wav')):\n",
         "    rot_quat.append(np.zeros(shape=(au_length, 4)))\n",
         "    anchor_t_shape.append(np.zeros(shape=(au_length, 68 * 3)))\n",
         "\n",
+        "if(os.path.exists(os.path.join('MakeItTalk/examples', 'dump', 'random_val_fl.pickle'))):\n",
+        "    os.remove(os.path.join('MakeItTalk/examples', 'dump', 'random_val_fl.pickle'))\n",
+        "if(os.path.exists(os.path.join('MakeItTalk/examples', 'dump', 'random_val_fl_interp.pickle'))):\n",
+        "    os.remove(os.path.join('MakeItTalk/examples', 'dump', 'random_val_fl_interp.pickle'))\n",
+        "if(os.path.exists(os.path.join('MakeItTalk/examples', 'dump', 'random_val_au.pickle'))):\n",
+        "    os.remove(os.path.join('MakeItTalk/examples', 'dump', 'random_val_au.pickle'))\n",
+        "if (os.path.exists(os.path.join('MakeItTalk/examples', 'dump', 'random_val_gaze.pickle'))):\n",
+        "    os.remove(os.path.join('MakeItTalk/examples', 'dump', 'random_val_gaze.pickle'))\n",
         "\n",
+        "with open(os.path.join('MakeItTalk/examples', 'dump', 'random_val_fl.pickle'), 'wb') as fp:\n",
         "    pickle.dump(fl_data, fp)\n",
+        "with open(os.path.join('MakeItTalk/examples', 'dump', 'random_val_au.pickle'), 'wb') as fp:\n",
         "    pickle.dump(au_data, fp)\n",
+        "with open(os.path.join('MakeItTalk/examples', 'dump', 'random_val_gaze.pickle'), 'wb') as fp:\n",
         "    gaze = {'rot_trans':rot_tran, 'rot_quat':rot_quat, 'anchor_t_shape':anchor_t_shape}\n",
         "    pickle.dump(gaze, fp)\n",
         "\n",
         "\n",
         "print(\"Audio->Landmark...\", file=sys.stderr)\n",
         "\n",
+        "fls = glob.glob1('MakeItTalk/examples', 'pred_fls_*.txt')\n",
         "fls.sort()\n",
         "\n",
         "for i in range(0,len(fls)):\n",
+        "    fl = np.loadtxt(os.path.join('MakeItTalk/examples', fls[i])).reshape((-1, 68,3))\n",
         "    fl[:, :, 0:2] = -fl[:, :, 0:2]\n",
         "    fl[:, :, 0:2] = fl[:, :, 0:2] / scale - shift\n",
         "\n",
         "    with torch.no_grad():\n",
         "        model.single_test(jpg=img, fls=fl, filename=fls[i], prefix=opt_parser.jpg.split('.')[0])\n",
         "        print('finish image2image gen')\n",
+        "    os.remove(os.path.join('MakeItTalk/examples', fls[i]))\n",
         "\n",
         "    print(\"{} / {}: Landmark->Face...\".format(i+1, len(fls)), file=sys.stderr)\n",
         "print(\"Done!\", file=sys.stderr)"

MakeItTalk/src/__pycache__/__init__.cpython-37.pyc CHANGED Viewed

Binary files a/MakeItTalk/src/__pycache__/__init__.cpython-37.pyc and b/MakeItTalk/src/__pycache__/__init__.cpython-37.pyc differ

MakeItTalk/src/approaches/__pycache__/__init__.cpython-37.pyc CHANGED Viewed

Binary files a/MakeItTalk/src/approaches/__pycache__/__init__.cpython-37.pyc and b/MakeItTalk/src/approaches/__pycache__/__init__.cpython-37.pyc differ

MakeItTalk/src/approaches/__pycache__/train_audio2landmark.cpython-37.pyc CHANGED Viewed

Binary files a/MakeItTalk/src/approaches/__pycache__/train_audio2landmark.cpython-37.pyc and b/MakeItTalk/src/approaches/__pycache__/train_audio2landmark.cpython-37.pyc differ

MakeItTalk/src/approaches/__pycache__/train_image_translation.cpython-37.pyc CHANGED Viewed

Binary files a/MakeItTalk/src/approaches/__pycache__/train_image_translation.cpython-37.pyc and b/MakeItTalk/src/approaches/__pycache__/train_image_translation.cpython-37.pyc differ

MakeItTalk/src/approaches/train_audio2landmark.py CHANGED Viewed

@@ -30,7 +30,7 @@ class Audio2landmark_model():
         # Step 1 : load opt_parser
         self.opt_parser = opt_parser
-        self.std_face_id = np.loadtxt('src/dataset/utils/STD_FACE_LANDMARKS.txt')
         if(jpg_shape is not None):
             self.std_face_id = jpg_shape
         self.std_face_id = self.std_face_id.reshape(1, 204)
@@ -75,10 +75,10 @@ class Audio2landmark_model():
         self.C.to(device)
         self.t_shape_idx = (27, 28, 29, 30, 33, 36, 39, 42, 45)
-        self.anchor_t_shape = np.loadtxt('src/dataset/utils/STD_FACE_LANDMARKS.txt')
         self.anchor_t_shape = self.anchor_t_shape[self.t_shape_idx, :]
-        with open(os.path.join('examples', 'dump', 'emb.pickle'), 'rb') as fp:
             self.test_embs = pickle.load(fp)
         print('====================================')
@@ -247,7 +247,7 @@ class Audio2landmark_model():
                 if(vis_fls):
                     from util.vis import Vis
                     Vis(fls=fake_fls_np, filename=video_name.split('\\')[-1].split('/')[-1], fps=62.5,
-                        audio_filenam=os.path.join('examples', video_name.split('\\')[-1].split('/')[-1]+'.wav'))
     def __close_face_lip__(self, fl):

         # Step 1 : load opt_parser
         self.opt_parser = opt_parser
+        self.std_face_id = np.loadtxt('MakeItTalk/src/dataset/utils/STD_FACE_LANDMARKS.txt')
         if(jpg_shape is not None):
             self.std_face_id = jpg_shape
         self.std_face_id = self.std_face_id.reshape(1, 204)
         self.C.to(device)
         self.t_shape_idx = (27, 28, 29, 30, 33, 36, 39, 42, 45)
+        self.anchor_t_shape = np.loadtxt('MakeItTalk/src/dataset/utils/STD_FACE_LANDMARKS.txt')
         self.anchor_t_shape = self.anchor_t_shape[self.t_shape_idx, :]
+        with open(os.path.join('MakeItTalk/examples', 'dump', 'emb.pickle'), 'rb') as fp:
             self.test_embs = pickle.load(fp)
         print('====================================')
                 if(vis_fls):
                     from util.vis import Vis
                     Vis(fls=fake_fls_np, filename=video_name.split('\\')[-1].split('/')[-1], fps=62.5,
+                        audio_filenam=os.path.join('MakeItTalk/examples', video_name.split('\\')[-1].split('/')[-1]+'.wav'))
     def __close_face_lip__(self, fl):

MakeItTalk/src/approaches/train_content.py CHANGED Viewed

@@ -32,7 +32,7 @@ class Audio2landmark_model():
         # Step 1 : load opt_parser
         self.opt_parser = opt_parser
-        self.std_face_id = np.loadtxt('src/dataset/utils/STD_FACE_LANDMARKS.txt')
         if(jpg_shape is not None):
             self.std_face_id = jpg_shape
         self.std_face_id = self.std_face_id.reshape(1, 204)
@@ -70,7 +70,7 @@ class Audio2landmark_model():
         self.C.to(device)
         self.t_shape_idx = (27, 28, 29, 30, 33, 36, 39, 42, 45)
-        self.anchor_t_shape = np.loadtxt('src/dataset/utils/STD_FACE_LANDMARKS.txt')
         self.anchor_t_shape = self.anchor_t_shape[self.t_shape_idx, :]
         self.opt_C = optim.Adam(self.C.parameters(), lr=opt_parser.lr, weight_decay=opt_parser.reg_lr)

         # Step 1 : load opt_parser
         self.opt_parser = opt_parser
+        self.std_face_id = np.loadtxt('MakeItTalk/src/dataset/utils/STD_FACE_LANDMARKS.txt')
         if(jpg_shape is not None):
             self.std_face_id = jpg_shape
         self.std_face_id = self.std_face_id.reshape(1, 204)
         self.C.to(device)
         self.t_shape_idx = (27, 28, 29, 30, 33, 36, 39, 42, 45)
+        self.anchor_t_shape = np.loadtxt('MakeItTalk/src/dataset/utils/STD_FACE_LANDMARKS.txt')
         self.anchor_t_shape = self.anchor_t_shape[self.t_shape_idx, :]
         self.opt_C = optim.Adam(self.C.parameters(), lr=opt_parser.lr, weight_decay=opt_parser.reg_lr)

MakeItTalk/src/approaches/train_noautovc.py CHANGED Viewed

@@ -381,7 +381,7 @@ class Speaker_aware_branch():
                 fake_fls_np = np.concatenate(fls_pred_pos_list)
                 filename = 'pred_fls_{}_{}.txt'.format(video_name.split('/')[-1], key)
-                np.savetxt(os.path.join('examples', filename), fake_fls_np, fmt='%.6f')
     def __close_face_lip__(self, fl):

                 fake_fls_np = np.concatenate(fls_pred_pos_list)
                 filename = 'pred_fls_{}_{}.txt'.format(video_name.split('/')[-1], key)
+                np.savetxt(os.path.join('MakeItTalk/examples', filename), fake_fls_np, fmt='%.6f')
     def __close_face_lip__(self, fl):

MakeItTalk/src/approaches/train_speaker_aware.py CHANGED Viewed

@@ -604,7 +604,7 @@ class Speaker_aware_branch():
                 fake_fls_np = np.concatenate(fls_pred_pos_list)
                 filename = 'pred_fls_{}_{}.txt'.format(video_name.split('/')[-1], key)
-                np.savetxt(os.path.join('examples', filename), fake_fls_np, fmt='%.6f')
     def __close_face_lip__(self, fl):

                 fake_fls_np = np.concatenate(fls_pred_pos_list)
                 filename = 'pred_fls_{}_{}.txt'.format(video_name.split('/')[-1], key)
+                np.savetxt(os.path.join('MakeItTalk/examples', filename), fake_fls_np, fmt='%.6f')
     def __close_face_lip__(self, fl):

MakeItTalk/src/autovc/AutoVC_mel_Convertor_retrain_version.py CHANGED Viewed

@@ -211,7 +211,7 @@ class AutoVC_mel_Convertor():
         g_checkpoint = torch.load(autovc_model_path, map_location=device)
         G.load_state_dict(g_checkpoint['model'])
-        emb = np.loadtxt('src/autovc/retrain_version/obama_emb.txt')
         emb_trg = torch.from_numpy(emb[np.newaxis, :].astype('float32')).to(device)
         aus = []

         g_checkpoint = torch.load(autovc_model_path, map_location=device)
         G.load_state_dict(g_checkpoint['model'])
+        emb = np.loadtxt('MakeItTalk/src/autovc/retrain_version/obama_emb.txt')
         emb_trg = torch.from_numpy(emb[np.newaxis, :].astype('float32')).to(device)
         aus = []

MakeItTalk/src/autovc/__pycache__/AutoVC_mel_Convertor_retrain_version.cpython-37.pyc CHANGED Viewed

Binary files a/MakeItTalk/src/autovc/__pycache__/AutoVC_mel_Convertor_retrain_version.cpython-37.pyc and b/MakeItTalk/src/autovc/__pycache__/AutoVC_mel_Convertor_retrain_version.cpython-37.pyc differ

MakeItTalk/src/autovc/__pycache__/__init__.cpython-37.pyc CHANGED Viewed

Binary files a/MakeItTalk/src/autovc/__pycache__/__init__.cpython-37.pyc and b/MakeItTalk/src/autovc/__pycache__/__init__.cpython-37.pyc differ

MakeItTalk/src/autovc/__pycache__/utils.cpython-37.pyc CHANGED Viewed

Binary files a/MakeItTalk/src/autovc/__pycache__/utils.cpython-37.pyc and b/MakeItTalk/src/autovc/__pycache__/utils.cpython-37.pyc differ

MakeItTalk/src/autovc/retrain_version/__pycache__/__init__.cpython-37.pyc CHANGED Viewed

Binary files a/MakeItTalk/src/autovc/retrain_version/__pycache__/__init__.cpython-37.pyc and b/MakeItTalk/src/autovc/retrain_version/__pycache__/__init__.cpython-37.pyc differ

MakeItTalk/src/autovc/retrain_version/__pycache__/model_vc_37_1.cpython-37.pyc CHANGED Viewed

Binary files a/MakeItTalk/src/autovc/retrain_version/__pycache__/model_vc_37_1.cpython-37.pyc and b/MakeItTalk/src/autovc/retrain_version/__pycache__/model_vc_37_1.cpython-37.pyc differ

MakeItTalk/src/autovc/retrain_version/vocoder_spec/__pycache__/__init__.cpython-37.pyc CHANGED Viewed

Binary files a/MakeItTalk/src/autovc/retrain_version/vocoder_spec/__pycache__/__init__.cpython-37.pyc and b/MakeItTalk/src/autovc/retrain_version/vocoder_spec/__pycache__/__init__.cpython-37.pyc differ

MakeItTalk/src/autovc/retrain_version/vocoder_spec/__pycache__/extract_f0_func.cpython-37.pyc CHANGED Viewed

Binary files a/MakeItTalk/src/autovc/retrain_version/vocoder_spec/__pycache__/extract_f0_func.cpython-37.pyc and b/MakeItTalk/src/autovc/retrain_version/vocoder_spec/__pycache__/extract_f0_func.cpython-37.pyc differ

MakeItTalk/src/autovc/retrain_version/vocoder_spec/__pycache__/utils.cpython-37.pyc CHANGED Viewed

Binary files a/MakeItTalk/src/autovc/retrain_version/vocoder_spec/__pycache__/utils.cpython-37.pyc and b/MakeItTalk/src/autovc/retrain_version/vocoder_spec/__pycache__/utils.cpython-37.pyc differ

MakeItTalk/src/dataset/__pycache__/__init__.cpython-37.pyc CHANGED Viewed

Binary files a/MakeItTalk/src/dataset/__pycache__/__init__.cpython-37.pyc and b/MakeItTalk/src/dataset/__pycache__/__init__.cpython-37.pyc differ

MakeItTalk/src/dataset/audio2landmark/__pycache__/__init__.cpython-37.pyc CHANGED Viewed

Binary files a/MakeItTalk/src/dataset/audio2landmark/__pycache__/__init__.cpython-37.pyc and b/MakeItTalk/src/dataset/audio2landmark/__pycache__/__init__.cpython-37.pyc differ

MakeItTalk/src/dataset/audio2landmark/__pycache__/audio2landmark_dataset.cpython-37.pyc CHANGED Viewed

Binary files a/MakeItTalk/src/dataset/audio2landmark/__pycache__/audio2landmark_dataset.cpython-37.pyc and b/MakeItTalk/src/dataset/audio2landmark/__pycache__/audio2landmark_dataset.cpython-37.pyc differ

MakeItTalk/src/dataset/audio2landmark/audio2landmark_dataset.py CHANGED Viewed

@@ -42,7 +42,7 @@ class Audio2landmark_Dataset(data.Dataset):
         self.fl_data = [self.fl_data[i] for i in valid_idx]
         self.au_data = [self.au_data[i] for i in valid_idx]
-        au_mean_std = np.loadtxt('src/dataset/utils/MEAN_STD_AUTOVC_RETRAIN_MEL_AU.txt')
         au_mean, au_std = au_mean_std[0:au_mean_std.shape[0]//2], au_mean_std[au_mean_std.shape[0]//2:]
         self.au_data = [((au - au_mean) / au_std, info) for au, info in self.au_data]
@@ -229,7 +229,7 @@ class Speaker_aware_branch_Dataset(data.Dataset):
         #     print('SAVE!')
-        au_mean_std = np.loadtxt('src/dataset/utils/MEAN_STD_AUTOVC_RETRAIN_MEL_AU.txt') # np.mean(self.au_data[0][0]), np.std(self.au_data[0][0])
         au_mean, au_std = au_mean_std[0:au_mean_std.shape[0]//2], au_mean_std[au_mean_std.shape[0]//2:]
         self.au_data = [((au - au_mean) / au_std, info) for au, info in self.au_data]

         self.fl_data = [self.fl_data[i] for i in valid_idx]
         self.au_data = [self.au_data[i] for i in valid_idx]
+        au_mean_std = np.loadtxt('MakeItTalk/src/dataset/utils/MEAN_STD_AUTOVC_RETRAIN_MEL_AU.txt')
         au_mean, au_std = au_mean_std[0:au_mean_std.shape[0]//2], au_mean_std[au_mean_std.shape[0]//2:]
         self.au_data = [((au - au_mean) / au_std, info) for au, info in self.au_data]
         #     print('SAVE!')
+        au_mean_std = np.loadtxt('MakeItTalk/src/dataset/utils/MEAN_STD_AUTOVC_RETRAIN_MEL_AU.txt') # np.mean(self.au_data[0][0]), np.std(self.au_data[0][0])
         au_mean, au_std = au_mean_std[0:au_mean_std.shape[0]//2], au_mean_std[au_mean_std.shape[0]//2:]
         self.au_data = [((au - au_mean) / au_std, info) for au, info in self.au_data]

MakeItTalk/src/dataset/image_translation/__pycache__/__init__.cpython-37.pyc CHANGED Viewed

Binary files a/MakeItTalk/src/dataset/image_translation/__pycache__/__init__.cpython-37.pyc and b/MakeItTalk/src/dataset/image_translation/__pycache__/__init__.cpython-37.pyc differ

MakeItTalk/src/dataset/image_translation/__pycache__/data_preparation.cpython-37.pyc CHANGED Viewed

Binary files a/MakeItTalk/src/dataset/image_translation/__pycache__/data_preparation.cpython-37.pyc and b/MakeItTalk/src/dataset/image_translation/__pycache__/data_preparation.cpython-37.pyc differ

MakeItTalk/src/dataset/image_translation/__pycache__/image_translation_dataset.cpython-37.pyc CHANGED Viewed

Binary files a/MakeItTalk/src/dataset/image_translation/__pycache__/image_translation_dataset.cpython-37.pyc and b/MakeItTalk/src/dataset/image_translation/__pycache__/image_translation_dataset.cpython-37.pyc differ

MakeItTalk/src/dataset/utils/__pycache__/Av2Flau_Convertor.cpython-37.pyc CHANGED Viewed

Binary files a/MakeItTalk/src/dataset/utils/__pycache__/Av2Flau_Convertor.cpython-37.pyc and b/MakeItTalk/src/dataset/utils/__pycache__/Av2Flau_Convertor.cpython-37.pyc differ

MakeItTalk/src/dataset/utils/__pycache__/__init__.cpython-37.pyc CHANGED Viewed

Binary files a/MakeItTalk/src/dataset/utils/__pycache__/__init__.cpython-37.pyc and b/MakeItTalk/src/dataset/utils/__pycache__/__init__.cpython-37.pyc differ

MakeItTalk/src/dataset/utils/__pycache__/icp.cpython-37.pyc CHANGED Viewed

Binary files a/MakeItTalk/src/dataset/utils/__pycache__/icp.cpython-37.pyc and b/MakeItTalk/src/dataset/utils/__pycache__/icp.cpython-37.pyc differ

MakeItTalk/src/models/__pycache__/__init__.cpython-37.pyc CHANGED Viewed

Binary files a/MakeItTalk/src/models/__pycache__/__init__.cpython-37.pyc and b/MakeItTalk/src/models/__pycache__/__init__.cpython-37.pyc differ

MakeItTalk/src/models/__pycache__/model_audio2landmark.cpython-37.pyc CHANGED Viewed

Binary files a/MakeItTalk/src/models/__pycache__/model_audio2landmark.cpython-37.pyc and b/MakeItTalk/src/models/__pycache__/model_audio2landmark.cpython-37.pyc differ

MakeItTalk/src/models/__pycache__/model_image_translation.cpython-37.pyc CHANGED Viewed

Binary files a/MakeItTalk/src/models/__pycache__/model_image_translation.cpython-37.pyc and b/MakeItTalk/src/models/__pycache__/model_image_translation.cpython-37.pyc differ

MakeItTalk/test.ipynb CHANGED Viewed

@@ -60,7 +60,7 @@
     "from IPython.core.debugger import Pdb;\n",
     "\n",
     "print(\"Choose the image name to animate: (saved in folder 'MakeItTalk/examples/')\")\n",
-    "img_list = glob.glob1('examples', '*.jpg')\n",
     "img_list.sort()\n",
     "img_list = [item.split('.')[0] for item in img_list]\n",
     "default_head_name = widgets.Dropdown(options=img_list, value='marlene_v2')\n",
@@ -157,7 +157,7 @@
     "parser.add_argument('--reuse_train_emb_list', type=str, nargs='+', default=[]) #  ['iWeklsXc0H8']) #['45hn7-LXDX8']) #['E_kmpT-EfOg']) #'iWeklsXc0H8', '29k8RtSUjE0', '45hn7-LXDX8',\n",
     "parser.add_argument('--add_audio_in', default=False, action='store_true') #we're using an audio file \n",
     "parser.add_argument('--comb_fan_awing', default=False, action='store_true') #not sure \n",
-    "parser.add_argument('--output_folder', type=str, default='examples') #which folder to store in \n",
     "parser.add_argument('--test_end2end', default=True, action='store_true') \n",
     "parser.add_argument('--dump_dir', type=str, default='', help='')\n",
     "parser.add_argument('--pos_dim', default=7, type=int)\n",
@@ -277,7 +277,7 @@
    "source": [
     "au_data = []\n",
     "au_emb = []\n",
-    "ains = glob.glob1('examples', '*.wav')\n",
     "ains = [item for item in ains if item != 'tmp.wav']\n",
     "ains.sort()\n",
     "for ain in ains:\n",
@@ -290,9 +290,9 @@
     "    au_emb.append(me.reshape(-1))\n",
     "\n",
     "    print('Processing audio file', ain)\n",
-    "    c = AutoVC_mel_Convertor('examples')\n",
     "\n",
-    "    au_data_i = c.convert_single_wav_to_autovc_input(audio_filename=os.path.join('examples', ain),\n",
     "           autovc_model_path=opt_parser.load_AUTOVC_name)\n",
     "    au_data += au_data_i\n",
     "print(f'this is {au_data}')\n",
@@ -320,20 +320,20 @@
     "    rot_quat.append(np.zeros(shape=(au_length, 4)))\n",
     "    anchor_t_shape.append(np.zeros(shape=(au_length, 68 * 3)))\n",
     "\n",
-    "if(os.path.exists(os.path.join('examples', 'dump', 'random_val_fl.pickle'))):\n",
-    "    os.remove(os.path.join('examples', 'dump', 'random_val_fl.pickle'))\n",
-    "if(os.path.exists(os.path.join('examples', 'dump', 'random_val_fl_interp.pickle'))):\n",
-    "    os.remove(os.path.join('examples', 'dump', 'random_val_fl_interp.pickle'))\n",
-    "if(os.path.exists(os.path.join('examples', 'dump', 'random_val_au.pickle'))):\n",
-    "    os.remove(os.path.join('examples', 'dump', 'random_val_au.pickle'))\n",
-    "if (os.path.exists(os.path.join('examples', 'dump', 'random_val_gaze.pickle'))):\n",
-    "    os.remove(os.path.join('examples', 'dump', 'random_val_gaze.pickle'))\n",
     "\n",
-    "with open(os.path.join('examples', 'dump', 'random_val_fl.pickle'), 'wb') as fp:\n",
     "    pickle.dump(fl_data, fp)\n",
-    "with open(os.path.join('examples', 'dump', 'random_val_au.pickle'), 'wb') as fp:\n",
     "    pickle.dump(au_data, fp)\n",
-    "with open(os.path.join('examples', 'dump', 'random_val_gaze.pickle'), 'wb') as fp:\n",
     "    gaze = {'rot_trans':rot_tran, 'rot_quat':rot_quat, 'anchor_t_shape':anchor_t_shape}\n",
     "    pickle.dump(gaze, fp)"
    ]
@@ -442,11 +442,11 @@
    "outputs": [],
    "source": [
     "#reshaping the data that we got \n",
-    "fls = glob.glob1('examples', 'pred_fls_*.txt')\n",
     "fls.sort()\n",
     "\n",
     "for i in range(0,len(fls)):\n",
-    "    fl = np.loadtxt(os.path.join('examples', fls[i])).reshape((-1, 68,3))\n",
     "    print(fls[i])\n",
     "    fl[:, :, 0:2] = -fl[:, :, 0:2]\n",
     "    fl[:, :, 0:2] = fl[:, :, 0:2] / scale - shift\n",
@@ -475,7 +475,7 @@
     "    with torch.no_grad():\n",
     "        model.single_test(jpg=img, fls=fl, filename=fls[i], prefix=opt_parser.jpg.split('.')[0])\n",
     "        print('finish image2image gen')\n",
-    "    os.remove(os.path.join('examples', fls[i]))\n",
     "\n",
     "    print(\"{} / {}: Landmark->Face...\".format(i+1, len(fls)), file=sys.stderr)\n",
     "print(\"Done!\", file=sys.stderr)"

     "from IPython.core.debugger import Pdb;\n",
     "\n",
     "print(\"Choose the image name to animate: (saved in folder 'MakeItTalk/examples/')\")\n",
+    "img_list = glob.glob1('MakeItTalk/examples', '*.jpg')\n",
     "img_list.sort()\n",
     "img_list = [item.split('.')[0] for item in img_list]\n",
     "default_head_name = widgets.Dropdown(options=img_list, value='marlene_v2')\n",
     "parser.add_argument('--reuse_train_emb_list', type=str, nargs='+', default=[]) #  ['iWeklsXc0H8']) #['45hn7-LXDX8']) #['E_kmpT-EfOg']) #'iWeklsXc0H8', '29k8RtSUjE0', '45hn7-LXDX8',\n",
     "parser.add_argument('--add_audio_in', default=False, action='store_true') #we're using an audio file \n",
     "parser.add_argument('--comb_fan_awing', default=False, action='store_true') #not sure \n",
+    "parser.add_argument('--output_folder', type=str, default='MakeItTalk/examples') #which folder to store in \n",
     "parser.add_argument('--test_end2end', default=True, action='store_true') \n",
     "parser.add_argument('--dump_dir', type=str, default='', help='')\n",
     "parser.add_argument('--pos_dim', default=7, type=int)\n",
    "source": [
     "au_data = []\n",
     "au_emb = []\n",
+    "ains = glob.glob1('MakeItTalk/examples', '*.wav')\n",
     "ains = [item for item in ains if item != 'tmp.wav']\n",
     "ains.sort()\n",
     "for ain in ains:\n",
     "    au_emb.append(me.reshape(-1))\n",
     "\n",
     "    print('Processing audio file', ain)\n",
+    "    c = AutoVC_mel_Convertor('MakeItTalk/examples')\n",
     "\n",
+    "    au_data_i = c.convert_single_wav_to_autovc_input(audio_filename=os.path.join('MakeItTalk/examples', ain),\n",
     "           autovc_model_path=opt_parser.load_AUTOVC_name)\n",
     "    au_data += au_data_i\n",
     "print(f'this is {au_data}')\n",
     "    rot_quat.append(np.zeros(shape=(au_length, 4)))\n",
     "    anchor_t_shape.append(np.zeros(shape=(au_length, 68 * 3)))\n",
     "\n",
+    "if(os.path.exists(os.path.join('MakeItTalk/examples', 'dump', 'random_val_fl.pickle'))):\n",
+    "    os.remove(os.path.join('MakeItTalk/examples', 'dump', 'random_val_fl.pickle'))\n",
+    "if(os.path.exists(os.path.join('MakeItTalk/examples', 'dump', 'random_val_fl_interp.pickle'))):\n",
+    "    os.remove(os.path.join('MakeItTalk/examples', 'dump', 'random_val_fl_interp.pickle'))\n",
+    "if(os.path.exists(os.path.join('MakeItTalk/examples', 'dump', 'random_val_au.pickle'))):\n",
+    "    os.remove(os.path.join('MakeItTalk/examples', 'dump', 'random_val_au.pickle'))\n",
+    "if (os.path.exists(os.path.join('MakeItTalk/examples', 'dump', 'random_val_gaze.pickle'))):\n",
+    "    os.remove(os.path.join('MakeItTalk/examples', 'dump', 'random_val_gaze.pickle'))\n",
     "\n",
+    "with open(os.path.join('MakeItTalk/examples', 'dump', 'random_val_fl.pickle'), 'wb') as fp:\n",
     "    pickle.dump(fl_data, fp)\n",
+    "with open(os.path.join('MakeItTalk/examples', 'dump', 'random_val_au.pickle'), 'wb') as fp:\n",
     "    pickle.dump(au_data, fp)\n",
+    "with open(os.path.join('MakeItTalk/examples', 'dump', 'random_val_gaze.pickle'), 'wb') as fp:\n",
     "    gaze = {'rot_trans':rot_tran, 'rot_quat':rot_quat, 'anchor_t_shape':anchor_t_shape}\n",
     "    pickle.dump(gaze, fp)"
    ]
    "outputs": [],
    "source": [
     "#reshaping the data that we got \n",
+    "fls = glob.glob1('MakeItTalk/examples', 'pred_fls_*.txt')\n",
     "fls.sort()\n",
     "\n",
     "for i in range(0,len(fls)):\n",
+    "    fl = np.loadtxt(os.path.join('MakeItTalk/examples', fls[i])).reshape((-1, 68,3))\n",
     "    print(fls[i])\n",
     "    fl[:, :, 0:2] = -fl[:, :, 0:2]\n",
     "    fl[:, :, 0:2] = fl[:, :, 0:2] / scale - shift\n",
     "    with torch.no_grad():\n",
     "        model.single_test(jpg=img, fls=fl, filename=fls[i], prefix=opt_parser.jpg.split('.')[0])\n",
     "        print('finish image2image gen')\n",
+    "    os.remove(os.path.join('MakeItTalk/examples', fls[i]))\n",
     "\n",
     "    print(\"{} / {}: Landmark->Face...\".format(i+1, len(fls)), file=sys.stderr)\n",
     "print(\"Done!\", file=sys.stderr)"

MakeItTalk/thirdparty/AdaptiveWingLoss/.gitignore DELETED Viewed

@@ -1,8 +0,0 @@
-# Python generated files
-*.pyc
-# Project related files
-ckpt/*.pth
-dataset/*
-!dataset/!.py
-experiments/*

MakeItTalk/thirdparty/AdaptiveWingLoss/__pycache__/__init__.cpython-37.pyc ADDED Viewed

Binary file (180 Bytes). View file

MakeItTalk/thirdparty/AdaptiveWingLoss/__pycache__/__init__.cpython-39.pyc ADDED Viewed

Binary file (179 Bytes). View file

MakeItTalk/thirdparty/AdaptiveWingLoss/ckpt/.gitkeep DELETED Viewed

File without changes

MakeItTalk/thirdparty/AdaptiveWingLoss/core/__pycache__/__init__.cpython-37.pyc ADDED Viewed

Binary file (185 Bytes). View file

MakeItTalk/thirdparty/AdaptiveWingLoss/core/__pycache__/__init__.cpython-39.pyc ADDED Viewed

Binary file (184 Bytes). View file