hexgrad
/

Kokoro-82M

generate method can optionally accept a phonetics argument

by bendangelo - opened 1 day ago

←

Files changed (1) hide show

kokoro.py CHANGED Viewed

@@ -131,8 +131,8 @@ def forward(model, tokens, ref_s, speed):
     asr = t_en @ pred_aln_trg.unsqueeze(0).to(device)
     return model.decoder(asr, F0_pred, N_pred, ref_s[:, :128]).squeeze().cpu().numpy()
-def generate(model, text, voicepack, speed=1):
-    ps = phonemize(text)
     tokens = tokenize(ps)
     if not tokens:
         return None
@@ -142,4 +142,4 @@ def generate(model, text, voicepack, speed=1):
     ref_s = voicepack[len(tokens)]
     out = forward(model, tokens, ref_s, speed)
     ps = ''.join(next(k for k, v in VOCAB.items() if i == v) for i in tokens)
-    return out, ps

     asr = t_en @ pred_aln_trg.unsqueeze(0).to(device)
     return model.decoder(asr, F0_pred, N_pred, ref_s[:, :128]).squeeze().cpu().numpy()
+def generate(model, text, voicepack, speed=1, ps=None):
+    ps = ps or phonemize(text)
     tokens = tokenize(ps)
     if not tokens:
         return None
     ref_s = voicepack[len(tokens)]
     out = forward(model, tokens, ref_s, speed)
     ps = ''.join(next(k for k, v in VOCAB.items() if i == v) for i in tokens)
+    return out, ps