Spaces:

englissi
/

engdialogue

Running

App Files Files Community

englissi commited on 3 days ago

Commit

9e130e4

verified ·

1 Parent(s): f5e8362

Create app.py

Browse files

Files changed (1) hide show

app.py +100 -0

app.py ADDED Viewed

	@@ -0,0 +1,100 @@

+import gradio as gr
+from gtts import gTTS
+from pydub import AudioSegment
+from io import BytesIO
+def multilingual_tts(
+    korean_text,
+    british_text,
+    american_text,
+    british_text_add1,
+    british_text_add2,
+    australian_text_add1,
+    australian_text_add2,
+    american_text_add1,
+    additional_english_text_9,
+    additional_english_text_10
+):
+    # 각 음성에 대해 (언어 코드, tld, 텍스트) 튜플을 리스트에 저장합니다.
+    voices = [
+        ("ko", "com", korean_text),                      # 한국어
+        ("en", "co.uk", british_text),                   # 기존 영국식
+        ("en", "com", american_text),                    # 기존 미국식
+        ("en", "co.uk", british_text_add1),              # 추가 영국식 1
+        ("en", "co.uk", british_text_add2),              # 추가 영국식 2
+        ("en", "com.au", australian_text_add1),          # 추가 호주식 1
+        ("en", "com.au", australian_text_add2),          # 추가 호주식 2
+        ("en", "com", american_text_add1),               # 추가 미국식 1
+        ("en", "com", additional_english_text_9),        # 추가 영어 9
+        ("en", "com", additional_english_text_10)        # 추가 영어 10
+    ]
+    combined_audio = AudioSegment.silent(duration=0)  # 빈 오디오
+    for lang, tld, text in voices:
+        if text.strip():  # 텍스트가 입력되어 있을 때만 처리
+            tts = gTTS(text, lang=lang, tld=tld)
+            audio_file = BytesIO()
+            tts.write_to_fp(audio_file)
+            audio_file.seek(0)
+            tts_audio = AudioSegment.from_file(audio_file, format="mp3")
+            # 각 음성 사이에 500ms의 침묵 추가
+            combined_audio += tts_audio + AudioSegment.silent(duration=500)
+    # 최종 결합된 오디오를 mp3 파일로 저장
+    output_file = "combined_output.mp3"
+    combined_audio.export(output_file, format="mp3")
+    return output_file
+with gr.Blocks() as demo:
+    gr.Markdown("## Multilingual TTS: Generate a Single Audio File (총 10개 음성)")
+    # 한국어 입력란
+    korean_input = gr.Textbox(label="Enter Korean Text:", placeholder="안녕하세요")
+    # 기존 영어 입력란 (영국식, 미국식)
+    with gr.Row():
+        british_input = gr.Textbox(label="Enter British English Text:", placeholder="Hello (British)")
+        american_input = gr.Textbox(label="Enter American English Text:", placeholder="Hello (American)")
+    # 추가 영어 입력란 (추가 영국식)
+    with gr.Row():
+        british_input_add1 = gr.Textbox(label="Enter Additional British English Text 1:", placeholder="Hi there (British)")
+        british_input_add2 = gr.Textbox(label="Enter Additional British English Text 2:", placeholder="Good day (British)")
+    # 추가 영어 입력란 (추가 호주식)
+    with gr.Row():
+        australian_input_add1 = gr.Textbox(label="Enter Additional Australian English Text 1:", placeholder="G'day (Australian)")
+        australian_input_add2 = gr.Textbox(label="Enter Additional Australian English Text 2:", placeholder="How ya going? (Australian)")
+    # 추가 영어 입력란 (추가 미국식 및 추가 영어)
+    with gr.Row():
+        american_input_add1 = gr.Textbox(label="Enter Additional American English Text 1:", placeholder="Hey (American)")
+        additional_english_input_9 = gr.Textbox(label="Enter Additional English Text 9:", placeholder="Additional dialogue 9 (English)")
+    # 마지막 추가 영어 입력란
+    additional_english_input_10 = gr.Textbox(label="Enter Additional English Text 10:", placeholder="Additional dialogue 10 (English)")
+    output_audio = gr.Audio(label="Generated Speech", type="filepath")
+    generate_button = gr.Button("Generate Speech")
+    generate_button.click(
+        multilingual_tts,
+        inputs=[
+            korean_input,
+            british_input,
+            american_input,
+            british_input_add1,
+            british_input_add2,
+            australian_input_add1,
+            australian_input_add2,
+            american_input_add1,
+            additional_english_input_9,
+            additional_english_input_10
+        ],
+        outputs=output_audio
+    )
+if __name__ == "__main__":
+    demo.launch()