Spaces:

xcczach
/

mini-omni-s2s

Sleeping

xcczach commited on about 1 month ago

Commit

f0abd45

•

1 Parent(s): c3f10f2

Update s2s.py

Files changed (1) hide show

s2s.py CHANGED Viewed

@@ -141,9 +141,16 @@ def generate_from_wav(
     return audio_hat, output_text
 def generate(
     wav_path: str, progress_callback: Callable[[str], None] | None = None
 ) -> tuple[np.ndarray, int | float]:
     config = OmegaConf.structured(InferenceConfig())
     train_config, model_config, dataset_config, decode_config = (
         config.train_config,
@@ -156,14 +163,14 @@ def generate(
     torch.manual_seed(train_config.seed)
     random.seed(train_config.seed)
-    update_progress(progress_callback, "Loading model")
-    model_factory = get_custom_model_factory(model_config)
-    model, _ = model_factory(train_config, model_config, CKPT_PATH)
-    codec_decoder = model.codec_decoder
-    device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
-    model.to(device)
-    model.eval()
     update_progress(progress_callback, "Generating")
     output_wav, output_text = generate_from_wav(

     return audio_hat, output_text
+model = None
+codec_decoder = None
+device = None
 def generate(
     wav_path: str, progress_callback: Callable[[str], None] | None = None
 ) -> tuple[np.ndarray, int | float]:
+    global model, codec_decoder, device
     config = OmegaConf.structured(InferenceConfig())
     train_config, model_config, dataset_config, decode_config = (
         config.train_config,
     torch.manual_seed(train_config.seed)
     random.seed(train_config.seed)
+    if model is None or codec_decoder is None or device is None:
+        update_progress(progress_callback, "Loading model")
+        model_factory = get_custom_model_factory(model_config)
+        model, _ = model_factory(train_config, model_config, CKPT_PATH)
+        codec_decoder = model.codec_decoder
+        device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
+        model.to(device)
+        model.eval()
     update_progress(progress_callback, "Generating")
     output_wav, output_text = generate_from_wav(