14-26AA commited on
Commit
e57b259
1 Parent(s): 9ac1698

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +3 -2
app.py CHANGED
@@ -16,7 +16,7 @@ with app:
16
  模型中各说话人的适宜中心音域分别为:\n
17
  aishell3(0-173号) 女性说话:A3,男性说话:C3\n
18
  opencpop(174号) 女性唱歌:C4-G4(超过C5基本失真)\n
19
- 如果转换通常说话音频,需要参考上面范围调key至目标说话人中心音域附近(如男性说话转为女性说话,key=8,反过来为-8)\n
20
  如果源音频为部分虚拟主播音频,通常音调会高于正常女性说话范围,可达到F4-A4左右,请适当降调\n
21
  对于说话人的详细信息(如性别、年龄等),可以在文件目录的spkdic_new.json中查看\n
22
  \n
@@ -24,7 +24,8 @@ with app:
24
  1.音域范围是否合适,可参考上文调整调key的参数,或更换说话人进行尝试\n
25
  2.源音频是否存在杂音/bgm,请尽量使用干净的音源进行合成,录音时保持室内安静\n
26
  3.源音频是否存在混响。较强的混响会显著干扰合成效果,导致ai念错字/音调识别错误等\n
27
- 4.再合成一次试试,每次合成会有部分随机性因素参与,微小的声调问题可能重新合成一次就不存在了。
 
28
  """)
29
  sid = gr.Dropdown(label="说话人",choices=spkdict, value='speaker0')
30
  vc_audio = gr.Audio(label="上传音频,建议小于2分钟",type='filepath')
 
16
  模型中各说话人的适宜中心音域分别为:\n
17
  aishell3(0-173号) 女性说话:A3,男性说话:C3\n
18
  opencpop(174号) 女性唱歌:C4-G4(超过C5基本失真)\n
19
+ 如果转换通常说话音频,需要参考上面范围调key至目标说话人中心音域附近(如男性说话转为女性说话,key=8,反过来为-8(4-16这个区间基本都可以试试))\n
20
  如果源音频为部分虚拟主播音频,通常音调会高于正常女性说话范围,可达到F4-A4左右,请适当降调\n
21
  对于说话人的详细信息(如性别、年龄等),可以在文件目录的spkdic_new.json中查看\n
22
  \n
 
24
  1.音域范围是否合适,可参考上文调整调key的参数,或更换说话人进行尝试\n
25
  2.源音频是否存在杂音/bgm,请尽量使用干净的音源进行合成,录音时保持室内安静\n
26
  3.源音频是否存在混响。较强的混响会显著干扰合成效果,导致ai念错字/音调识别错误等\n
27
+ 4.再合成一次试试,每次合成会有部分随机性因素参与,微小的声调问题可能重新合成一次就不存在了。\n
28
+ 5.部分对源音频的消伴奏/降噪处理会对合成效果有较大影响,虽然人听不出差别,但是对ai识别的频谱有影响。
29
  """)
30
  sid = gr.Dropdown(label="说话人",choices=spkdict, value='speaker0')
31
  vc_audio = gr.Audio(label="上传音频,建议小于2分钟",type='filepath')