CEHB commited on
Commit
cfc25e8
1 Parent(s): fd5379f

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +10 -9
app.py CHANGED
@@ -14,8 +14,9 @@ vocoder = SpeechT5HifiGan.from_pretrained("microsoft/speecht5_hifigan")
14
 
15
 
16
  speaker_embeddings = {
17
- "BDL": "spkemb/cmu_us_bdl_arctic-wav-arctic_a0009.npy",
18
- "CLB": "spkemb/cmu_us_clb_arctic-wav-arctic_a0144.npy",
 
19
  }
20
 
21
 
@@ -50,7 +51,7 @@ def predict(text, speaker):
50
  input_ids = inputs["input_ids"]
51
  input_ids = input_ids[..., :model.config.max_text_positions]
52
 
53
- speaker_embedding = np.load(speaker_embeddings[speaker[:3]])
54
 
55
  speaker_embedding = torch.tensor(speaker_embedding).unsqueeze(0)
56
 
@@ -95,10 +96,10 @@ article = """
95
 
96
  examples = [
97
  ["GreenCounsel grundades i Malmö för sex år sedan.", "CLB (female)"],
98
- ["Med hjälp av maskininlärning kan mycket av juridiken automatiseras samtidigt som juristerna fokuserar på frågor där de ger störst värde.", "BDL (male)"],
99
- ["GreenCounsel har byggt en chatbott som kan förstå frågor på många olika språk och ge kvalitetssäkrade svar.", "CLB (female)"],
100
- ["Vi har också byggt ett system för att automatisera arbetsflöden för juridiska tjänster via internet.", "BDL (male)"],
101
- ["Talsyntesen bygger på en engelsk modell och kan därför upplevas som att jag bryter lite på engelska.","CLB (female)"]
102
  ]
103
 
104
  gr.Interface(
@@ -106,10 +107,10 @@ gr.Interface(
106
  inputs=[
107
  gr.Text(label="Input Text"),
108
  gr.Radio(label="Speaker", choices=[
109
- "CLB (female)",
110
 
111
  ],
112
- value="CLB (female)"),
113
  ],
114
  outputs=[
115
  gr.Audio(label="Generated Speech", type="numpy"),
 
14
 
15
 
16
  speaker_embeddings = {
17
+ "Female": "spkemb/cmu_us_clb_arctic-wav-arctic_a0144.npy",
18
+ "Male": "spkemb/cmu_us_bdl_arctic-wav-arctic_a0009.npy",
19
+
20
  }
21
 
22
 
 
51
  input_ids = inputs["input_ids"]
52
  input_ids = input_ids[..., :model.config.max_text_positions]
53
 
54
+ speaker_embedding = np.load(speaker_embeddings[speaker])
55
 
56
  speaker_embedding = torch.tensor(speaker_embedding).unsqueeze(0)
57
 
 
96
 
97
  examples = [
98
  ["GreenCounsel grundades i Malmö för sex år sedan.", "CLB (female)"],
99
+ ["Med hjälp av maskininlärning kan mycket av juridiken automatiseras samtidigt som juristerna fokuserar på frågor där de ger störst värde.", "Male"],
100
+ ["GreenCounsel har byggt en chatbott som kan förstå frågor på många olika språk och ge kvalitetssäkrade svar.", "Female"],
101
+ ["Vi har också byggt ett system för att automatisera arbetsflöden för juridiska tjänster via internet.", "Male"],
102
+ ["Talsyntesen bygger på en engelsk modell och kan därför upplevas som att jag bryter lite på engelska.","Female"]
103
  ]
104
 
105
  gr.Interface(
 
107
  inputs=[
108
  gr.Text(label="Input Text"),
109
  gr.Radio(label="Speaker", choices=[
110
+ "Female",
111
 
112
  ],
113
+ value="Female"),
114
  ],
115
  outputs=[
116
  gr.Audio(label="Generated Speech", type="numpy"),