Spaces:

Mahiruoshi
/

BangDream-Bert-VITS2

Running

App Files Files Community

Mahiruoshi commited on Jan 31

Commit

625ce8a

•

1 Parent(s): 989f4af

Update app.py

Browse files

Files changed (1) hide show

app.py +113 -1

app.py CHANGED Viewed

@@ -91,6 +91,9 @@ BandList = {
         "Morfonica":["ましろ","瑠唯","つくし","七深","透子"],
         "MyGo":["燈","愛音","そよ","立希","楽奈"],
         "AveMujica":["祥子","睦","海鈴","にゃむ","初華"],
         "圣翔音乐学园":["華戀","光","香子","雙葉","真晝","純那","克洛迪娜","真矢","奈奈"],
         "凛明馆女子学校":["珠緒","壘","文","悠悠子","一愛"],
         "弗隆提亚艺术学校":["艾露","艾露露","菈樂菲","司","靜羽"],
@@ -873,7 +876,116 @@ if __name__ == "__main__":
                                         label="文本输入,可用'|'分割说话人和文本,注意换行",
                                         info="输入纯日语或者中文",
                                         placeholder=f"{name}|你觉得你是职业歌手吗\n真白|我觉得我是",
-                                        value=f"私は{name}です、あの子はだれ？ "
                                     )
                                 style_text = gr.Textbox(
                                     label="情感辅助文本",

         "Morfonica":["ましろ","瑠唯","つくし","七深","透子"],
         "MyGo":["燈","愛音","そよ","立希","楽奈"],
         "AveMujica":["祥子","睦","海鈴","にゃむ","初華"],
+}
+SchoolLilst = {
         "圣翔音乐学园":["華戀","光","香子","雙葉","真晝","純那","克洛迪娜","真矢","奈奈"],
         "凛明馆女子学校":["珠緒","壘","文","悠悠子","一愛"],
         "弗隆提亚艺术学校":["艾露","艾露露","菈樂菲","司","靜羽"],
                                         label="文本输入,可用'|'分割说话人和文本,注意换行",
                                         info="输入纯日语或者中文",
                                         placeholder=f"{name}|你觉得你是职业歌手吗\n真白|我觉得我是",
+                                        value=f"私は{name}です。 "
+                                    )
+                                style_text = gr.Textbox(
+                                    label="情感辅助文本",
+                                    info="语言保持跟主文本一致,文本可以参考训练集:https://huggingface.co/spaces/Mahiruoshi/BangDream-Bert-VITS2/blob/main/filelists/Mygo.list)",
+                                    placeholder="使用辅助文本的语意来辅助生成对话（语言保持与主文本相同）\n\n"
+                        "**注意**：不要使用**指令式文本**（如：开心），要使用**带有强烈情感的文本**（如：我好快乐！！！）"
+                                                        )
+                                style_weight = gr.Slider(
+                                        minimum=0,
+                                        maximum=1,
+                                        value=0.7,
+                                        step=0.1,
+                                        label="Weight",
+                                        info="主文本和辅助文本的bert混合比率，0表示仅主文本，1表示仅辅助文本",
+                                    )
+                                btn = gr.Button("点击生成", variant="primary")
+                                audio_output = gr.Audio(label="Output Audio")
+                                btntran = gr.Button("快速中翻日")
+                                translateResult = gr.TextArea(label="使用百度翻译",placeholder="从这里复制翻译后的文本")
+                                btntran.click(translate, inputs=[text], outputs = [translateResult])
+                    btn.click(
+                        generate_audio,
+                        inputs=[
+                            inputFile,
+                            groupSize,
+                            filepath,
+                            silenceTime,
+                            speakerList,
+                            text,
+                            sdp_ratio,
+                            noise_scale,
+                            noise_scale_w,
+                            length_scale,
+                            speaker,
+                            style_text,
+                            style_weight,
+                            language,
+                            mode,
+                            sentence_mode,
+                            skip_start,
+                            skip_end
+                        ],
+                        outputs=[audio_output],
+                    )
+        for band in SchoolLilst:
+            with gr.TabItem(band):
+                for name in BandList[band]:
+                    with gr.TabItem(name):
+                        with gr.Row():
+                            with gr.Column():
+                                with gr.Row():
+                                    gr.Markdown(
+                                        '<div align="center">'
+                                        f'<img style="width:auto;height:400px;" src="https://mahiruoshi-bangdream-bert-vits2.hf.space/file/image/{name}.png">'
+                                        '</div>'
+                                    )
+                                with gr.Accordion(label="参数设定", open=False):
+                                    sdp_ratio = gr.Slider(
+                                    minimum=0, maximum=1, value=0.5, step=0.01, label="SDP/DP混合比"
+                                    )
+                                    noise_scale = gr.Slider(
+                                        minimum=0.1, maximum=2, value=0.6, step=0.01, label="Noise:感情调节"
+                                    )
+                                    noise_scale_w = gr.Slider(
+                                        minimum=0.1, maximum=2, value=0.667, step=0.01, label="Noise_W:音素长度"
+                                    )
+                                    skip_start = gr.Checkbox(label="skip_start")
+                                    skip_end = gr.Checkbox(label="skip_end")
+                                    speaker = gr.Dropdown(
+                                        choices=speakers, value=name, label="说话人"
+                                    )
+                                length_scale = gr.Slider(
+                                        minimum=0.1, maximum=2, value=1, step=0.01, label="语速调节"
+                                    )
+                                language = gr.Dropdown(
+                                        choices=languages, value="Auto", label="语言选择,若不选自动则会将输入语言翻译为日语或中文"
+                                    )
+                                mode = gr.Dropdown(
+                                        choices=modes, value="pyopenjtalk-V2.3-Katakana", label="TTS模式，合成少歌角色需要切换成 pyopenjtalk-V2.3-Katakana "
+                                    )
+                                sentence_mode = gr.Dropdown(
+                                        choices=sentence_modes, value="sentence", label="文本合成模式"
+                                    )
+                                with gr.Accordion(label="扩展选项", open=False):
+                                    inputFile = gr.UploadButton(label="txt文件输入")
+                                    speakerList = gr.TextArea(
+                                        label="角色对应表,如果你记不住角色名可以这样,左边是你想要在每一句话合成中用到的speaker(见角色清单)右边是你上传文本时分隔符左边设置的说话人:{ChoseSpeakerFromConfigList}|{SeakerInUploadText}",
+                                        value = "ましろ|真白\n七深|七深\n透子|透子\nつくし|筑紫\n瑠唯|瑠唯\nそよ|素世\n祥子|祥子",
+                                    )
+                                    groupSize = gr.Slider(
+                                        minimum=10, maximum=1000 if  torch.cuda.is_available() else 50,value = 50, step=1, label="单个音频文件包含的最大句子数"
+                                    )
+                                    filepath = gr.TextArea(
+                                        label="本地合成时的音频存储文件夹(会清空文件夹,别把C盘删了)",
+                                        value = "D:/audiobook/book1",
+                                    )
+                                    silenceTime = gr.Slider(
+                                        minimum=0, maximum=1, value=0.5, step=0.01, label="句子的间隔"
+                                    )
+                                    modelstrs = gr.Dropdown(label = "模型", choices = modelPaths, value = modelPaths[0], type = "value")
+                                    btnMod = gr.Button("载入模型")
+                                    statusa = gr.TextArea(label = "模型加载状态")
+                                    btnMod.click(loadmodel, inputs=[modelstrs], outputs = [statusa])
+                            with gr.Column():
+                                text = gr.TextArea(
+                                        label="文本输入,可用'|'分割说话人和文本,注意换行",
+                                        info="输入纯日语或者中文",
+                                        placeholder=f"{name}|你觉得你是职业歌手吗\n真白|我觉得我是",
+                                        value=f"私は{name}です。 "
                                     )
                                 style_text = gr.Textbox(
                                     label="情感辅助文本",