Spaces:

GreenCounsel
/

SpeechT5-sv

Runtime error

App Files Files Community

CEHB commited on Jul 20, 2023

Commit

cfc25e8

•

1 Parent(s): fd5379f

Update app.py

Browse files

Files changed (1) hide show

app.py +10 -9

app.py CHANGED Viewed

@@ -14,8 +14,9 @@ vocoder = SpeechT5HifiGan.from_pretrained("microsoft/speecht5_hifigan")
 speaker_embeddings = {
-    "BDL": "spkemb/cmu_us_bdl_arctic-wav-arctic_a0009.npy",
-    "CLB": "spkemb/cmu_us_clb_arctic-wav-arctic_a0144.npy",
 }
@@ -50,7 +51,7 @@ def predict(text, speaker):
     input_ids = inputs["input_ids"]
     input_ids = input_ids[..., :model.config.max_text_positions]
-    speaker_embedding = np.load(speaker_embeddings[speaker[:3]])
     speaker_embedding = torch.tensor(speaker_embedding).unsqueeze(0)
@@ -95,10 +96,10 @@ article = """
 examples = [
     ["GreenCounsel grundades i Malmö för sex år sedan.", "CLB (female)"],
-    ["Med hjälp av maskininlärning kan mycket av juridiken automatiseras samtidigt som juristerna fokuserar på frågor där de ger störst värde.", "BDL (male)"],
-    ["GreenCounsel har byggt en chatbott som kan förstå frågor på många olika språk och ge kvalitetssäkrade svar.", "CLB (female)"],
-    ["Vi har också byggt ett system för att automatisera arbetsflöden för juridiska tjänster via internet.", "BDL (male)"],
-    ["Talsyntesen bygger på en engelsk modell och kan därför upplevas som att jag bryter lite på engelska.","CLB (female)"]
 ]
 gr.Interface(
@@ -106,10 +107,10 @@ gr.Interface(
     inputs=[
         gr.Text(label="Input Text"),
         gr.Radio(label="Speaker", choices=[
-            "CLB (female)",
         ],
-        value="CLB (female)"),
     ],
     outputs=[
         gr.Audio(label="Generated Speech", type="numpy"),

 speaker_embeddings = {
+    "Female": "spkemb/cmu_us_clb_arctic-wav-arctic_a0144.npy",
+    "Male": "spkemb/cmu_us_bdl_arctic-wav-arctic_a0009.npy",
 }
     input_ids = inputs["input_ids"]
     input_ids = input_ids[..., :model.config.max_text_positions]
+    speaker_embedding = np.load(speaker_embeddings[speaker])
     speaker_embedding = torch.tensor(speaker_embedding).unsqueeze(0)
 examples = [
     ["GreenCounsel grundades i Malmö för sex år sedan.", "CLB (female)"],
+    ["Med hjälp av maskininlärning kan mycket av juridiken automatiseras samtidigt som juristerna fokuserar på frågor där de ger störst värde.", "Male"],
+    ["GreenCounsel har byggt en chatbott som kan förstå frågor på många olika språk och ge kvalitetssäkrade svar.", "Female"],
+    ["Vi har också byggt ett system för att automatisera arbetsflöden för juridiska tjänster via internet.", "Male"],
+    ["Talsyntesen bygger på en engelsk modell och kan därför upplevas som att jag bryter lite på engelska.","Female"]
 ]
 gr.Interface(
     inputs=[
         gr.Text(label="Input Text"),
         gr.Radio(label="Speaker", choices=[
+            "Female",
         ],
+        value="Female"),
     ],
     outputs=[
         gr.Audio(label="Generated Speech", type="numpy"),