Spaces:

YoMioAI
/

GPT-SoVITS-3s-cloning-free-TTS

Running

App Files Files Community

Xinonria commited on Sep 16, 2024

Commit

6915670

1 Parent(s): 40f2a20

add create voice

Browse files

Files changed (7) hide show

api.py +89 -5
app.py +398 -161
i18n/characters_en.csv +0 -0
i18n/characters_ja.csv +0 -0
i18n/characters_ko.csv +0 -0
i18n/characters_zh.csv +0 -0
i18n/translations.json +40 -0

api.py CHANGED Viewed

@@ -1,11 +1,40 @@
 import asyncio
 import aiohttp
-import io
-import os
 from utils import normalize_audio_loudness
-BASE_URL = os.getenv("BASE_URL")
-AUDIO_URL = os.getenv("AUDIO_URL")
 async def generate_api(voice_ids, text):
     timeout = aiohttp.ClientTimeout(total=10)  # 设置10秒的总超时时间
@@ -16,7 +45,6 @@ async def generate_api(voice_ids, text):
                     # 读取响应内容
                     audio_data = await response.read()
                     # print(type(audio_data))
-                    # 创建一个字节流对象
                     audio_data = normalize_audio_loudness(audio_data)
                     return audio_data
                 else:
@@ -40,3 +68,59 @@ async def get_audio(voice_id):
         return "请求超时，请稍后重试"
     except aiohttp.ClientError as e:
         return f"网络错误: {str(e)}"

 import asyncio
+from datetime import datetime
 import aiohttp
+import pickle
+import pandas as pd
 from utils import normalize_audio_loudness
+import os
+from dotenv import load_dotenv
+from pymongo import MongoClient
+from bson import Binary, ObjectId
+# 尝试直接获取环境变量
+BASE_URL = os.environ.get("BASE_URL")
+AUDIO_URL = os.environ.get("AUDIO_URL")
+MONGO_URI = os.environ.get("MONGO_URI")
+DATABASE_NAME = os.environ.get("DATABASE_NAME")
+COLLECTION_NAME = os.environ.get("COLLECTION_NAME")
+CREATE_COLLECTION = os.environ.get("CREATE_COLLECTION")
+# 如果直接获取不到，则从.env文件加载
+if BASE_URL is None or AUDIO_URL is None or MONGO_URI is None or DATABASE_NAME is None or COLLECTION_NAME is None or CREATE_COLLECTION is None:
+    print("从.env文件加载环境变量")
+    load_dotenv()
+    BASE_URL = os.getenv("BASE_URL")
+    AUDIO_URL = os.getenv("AUDIO_URL")
+    MONGO_URI = os.getenv("MONGO_URI")
+    DATABASE_NAME = os.getenv("DATABASE_NAME")
+    COLLECTION_NAME = os.getenv("COLLECTION_NAME")
+    CREATE_COLLECTION = os.getenv("CREATE_COLLECTION")
+client = MongoClient(MONGO_URI)
+db = client[DATABASE_NAME]
+collection = db[COLLECTION_NAME]
+create_collection = db[CREATE_COLLECTION]
 async def generate_api(voice_ids, text):
     timeout = aiohttp.ClientTimeout(total=10)  # 设置10秒的总超时时间
                     # 读取响应内容
                     audio_data = await response.read()
                     # print(type(audio_data))
                     audio_data = normalize_audio_loudness(audio_data)
                     return audio_data
                 else:
         return "请求超时，请稍后重试"
     except aiohttp.ClientError as e:
         return f"网络错误: {str(e)}"
+def load_characters_csv(lang):
+    # 从MongoDB集合中获取数据
+    cursor = collection.find({"language": lang, "is_public": True})
+    # 将查询结果转换为列表
+    data = list(cursor)
+    # 创建一个空的DataFrame
+    df = pd.DataFrame(columns=["类别", "id", "名称", "情绪", "头像", "voice_id"])
+    # 遍历数据并填充DataFrame
+    for item in data:
+        df = pd.concat([df, pd.DataFrame({
+            "类别": [item["category"]],
+            "id": [str(item["id"])],  # 确保id是字符串类型
+            "名称": [item["name"]],
+            "情绪": [item["emotion"]],
+            "头像": [item["avatar"]],
+            "voice_id": [item["voice_id"]]
+        })], ignore_index=True)
+    指定顺序 = {
+        "zh": ["原神", "崩坏星穹铁道", "绝区零", "鸣潮"],
+        "en": ["Genshin Impact", "Honkai: Star Rail", "Zenless Zone Zero", "Wuthering Waves"],
+        "ja": ["原神[げんしん", "崩壊：スターレイル", "ゼンレスゾーンゼロ", "Wuthering Waves"],
+        "ko": ["원신", "붕괴: 스타레일", "젠레스 존 제로", "Wuthering Waves"]
+    }
+    当前语言顺序 = 指定顺序.get(lang, 指定顺序["en"])
+    其他类别 = sorted(set(df['类别'].unique()) - set(当前语言顺序))
+    unique_categories = 当前语言顺序 + 其他类别
+    return df, unique_categories
+async def generate_voice(avatar, name, emotion, tags, gender, audio_data, language):
+    # 将图像数据转换为二进制
+    avatar_binary = pickle.dumps(avatar)
+    # 将音频数据转换为二进制
+    audio_binary = pickle.dumps(audio_data)
+    # 创建声音对象
+    voice = {
+        "avatar": Binary(avatar_binary),
+        "name": name,
+        "emotion": emotion,
+        "tags": tags,
+        "gender": gender,
+        "audio_data": Binary(audio_binary),
+        "language": language,
+        "create_at": datetime.now().isoformat(),
+        "is_public": False
+    }
+    result = create_collection.insert_one(voice)
+    return result.inserted_id

app.py CHANGED Viewed

@@ -1,68 +1,101 @@
 import time
 import os
 import logging
-from io import StringIO
 import gradio as gr
 import pandas as pd
 from pypinyin import lazy_pinyin
-from gradio_i18n import gettext, Translate
-from api import generate_api, get_audio
 from utils import get_length
 # 翻译文件位置
-trans_file = os.path.join(os.path.dirname(__file__),"i18n", "translations.json")
 # 关闭aiohttp的DEBUG日志
-logging.getLogger('aiohttp').setLevel(logging.WARNING)
-logging.getLogger("gradio").setLevel(logging.WARNING)
 # 带有时间的log
-logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')
-header = "header"
 terms = "terms"
-def load_characters_csv(lang):
-    name = os.path.join(os.path.dirname(__file__), "i18n", f"characters_{lang}.csv")
-    return pd.read_csv(name)
-def update_all_characters(lang, current_all_characters):
-    new_characters = load_characters_csv(lang)
-    initial_characters = get_characters(kind="原神", all_characters=new_characters)
-    return new_characters, initial_characters, gr.Gallery(value=[[char['头像'], char['名称']] for char in initial_characters],
-                                 show_label=False, elem_id="character_gallery", columns=[11],
-                                 object_fit="contain", height="auto", interactive=False,
-                                 allow_preview=False, selected_index=None)
-def get_characters(query=None, page=1, per_page=400, kind="原神", lang="zh", all_characters=None):
     # 使用传入的 all_characters 参数
     filtered_characters = all_characters[all_characters["类别"] == kind]
     if query:
         # 使用拼音和汉字进行搜索
         filtered_characters = filtered_characters[
-            filtered_characters['名称'].str.contains(query, case=False)
         ]
-        if filtered_characters.empty and lang == 'zh':
             filtered_characters = all_characters[all_characters["类别"] == kind]
             filtered_characters = filtered_characters[
-                filtered_characters['名称'].apply(lambda x: ''.join(lazy_pinyin(x))).str.contains(query, case=False)
             ]
     # 按名称分组，并选择每组的第一个记录
-    unique_characters = filtered_characters.groupby('名称').first().reset_index().sort_values(by='id')
     # 应用分页
     start_index = (page - 1) * per_page
     end_index = start_index + per_page
-    return unique_characters.iloc[start_index:end_index].to_dict('records')
-async def generate(selected_character = None, selected_characters = [], text = "", lang="zh"):
     # print("-------",selected_character)
     # print("-------",selected_characters)
     if selected_character:
@@ -79,10 +112,10 @@ async def generate(selected_character = None, selected_characters = [], text = "
         elif lang == "ko":
             raise gr.Error("먼저 캐릭터를 선택하세요")
     voice_ids = [char.get("voice_id") for char in characters if char.get("voice_id")]
     if not voice_ids:
         raise gr.Error("所选角色没有关联的 voice_id")
     start_time = time.time()
     # 假设我们只使用第一个选择的角色的名称
     if voice_ids == "1":
@@ -94,7 +127,7 @@ async def generate(selected_character = None, selected_characters = [], text = "
             raise gr.Error("そのキャラクターの音声はまだ作成されていません")
         elif lang == "ko":
             raise gr.Error("해당 캐릭터의 음성이 아직 생성되지 않았습니다")
     if text == "":
         if lang == "zh":
             raise gr.Error("请输入需要合成的文本")
@@ -104,7 +137,7 @@ async def generate(selected_character = None, selected_characters = [], text = "
             raise gr.Error("合成するテキストを入力してください")
         elif lang == "ko":
             raise gr.Error("합성할 텍스트를 입력하세요")
     if get_length(text) > 1024:
         if lang == "zh":
             raise gr.Error("长度请控制在1024个字符以内")
@@ -114,13 +147,18 @@ async def generate(selected_character = None, selected_characters = [], text = "
             raise gr.Error("テキストの長さが1024文字を超えています")
         elif lang == "ko":
             raise gr.Error("텍스트 길이가 1024자를 초과합니다")
     audio = await generate_api(voice_ids, text)
     end_time = time.time()
     if lang == "zh":
         cost_time = f"合成共花费{end_time - start_time:.2f}秒"
     elif lang == "en":
-        cost_time = f"Total time spent synthesizing: {end_time - start_time:.2f} seconds"
     elif lang == "ja":
         cost_time = f"合成にかかった時間: {end_time - start_time:.2f}秒"
     elif lang == "ko":
@@ -131,25 +169,37 @@ async def generate(selected_character = None, selected_characters = [], text = "
     else:
         return audio, cost_time
 def get_character_emotions(character, all_characters):
     # 从all_characters中筛选出与当前角色名称相同的所有记录
-    character_records = all_characters[all_characters['名称'] == character['名称']]
     # 按情绪去重并获取完整的角色信息
-    character_infos = character_records.drop_duplicates(subset=['情绪']).to_dict('records')
     # 如果没有找到角色信息，返回一个包含默认值的字典
-    return character_infos if character_infos else [{"名称": character['名称'], "情绪": "默认情绪"}]
 def update_character_info(character_name, emotion, current_character, all_characters):
     character_info = None
     if character_name and emotion:
-        character_info = all_characters[(all_characters['名称'] == character_name) & (all_characters['情绪'] == emotion)]
     if character_name == "":
         return None
     character_info = character_info.iloc[0].to_dict()
     return character_info, all_characters
 def add_new_voice(current_character, selected_characters, kind, lang, all_characters):
     if not current_character:
         if lang == "zh":
@@ -160,78 +210,128 @@ def add_new_voice(current_character, selected_characters, kind, lang, all_charac
             raise gr.Error("まず、キャラクターを選択してください")
         elif lang == "ko":
             raise gr.Error("먼저 캐릭터를 선택하세요")
     if len(selected_characters) >= 5:
         raise gr.Error("已达到最大选择数（5个）")
     # 检查是否已存在相同角色
-    existing_char = next((char for char in selected_characters if char['名称'] == current_character['名称']), None)
     if existing_char:
         # 如果情绪不同,更新情绪
-        if existing_char['情绪'] != current_character['情绪']:
-            existing_char['情绪'] = current_character['情绪']
     else:
         selected_characters.insert(0, current_character)
-    updated_characters = get_characters(kind=kind, lang=lang, all_characters=all_characters)
     # ! 取消gallery选中状态,返回个新的gallery是必要的，否则会保留上一次的选中状态。这里sonnet很喜欢改成返回一个数组，但这不能清空gallery的选中状态
-    updated_gallery = gr.Gallery(value=[[char['头像'], char['名称']] for char in updated_characters],
-                                 show_label=False, elem_id="character_gallery", columns=[11],
-                                 object_fit="contain", height="auto", interactive=False,
-                                 allow_preview=False, selected_index=None)
-    return (None, gr.update(value=""), gr.update(choices=[]), selected_characters,
-            updated_characters, updated_gallery, gr.update(visible=True), all_characters)
 def update_selected_chars_display(selected_characters):
     updates = []
     for i, (name, emotion, _, row) in enumerate(selected_chars_rows):
         if i < len(selected_characters):
             char = selected_characters[i]
-            updates.extend([
-                gr.update(value=char['名称'], visible=True),
-                gr.update(value=char['情绪'], visible=True),
-                gr.update(visible=True),
-                gr.update(visible=True)
-            ])
         else:
-            updates.extend([
-                gr.update(value="", visible=False),
-                gr.update(value="", visible=False),
-                gr.update(visible=False),
-                gr.update(visible=False)
-            ])
     return updates
 def remove_character(index, selected_characters):
     if 0 <= index < len(selected_characters):
-        del selected_characters[index]
     return selected_characters, gr.update(visible=True)
 def update_gallery(kind, query, all_characters):
-    updated_characters = get_characters(kind=kind, query=query, lang=lang, all_characters=all_characters)
-    return updated_characters, [[char['头像'], char['名称']] for char in updated_characters], all_characters
 def on_select(evt: gr.SelectData, characters, selected_characters, all_characters):
     # 如果没有选择角色，换人的时候清空
     if len(selected_characters) == 0:
         selected_characters = []
     selected = characters[evt.index]
     emotions = get_character_emotions(selected, all_characters)
     normal_index = 0
     for index, emotion in enumerate(emotions):
-        if emotion["情绪"] == "正常" or emotion["情绪"] == "보통" or emotion["情绪"] == "normal":
             normal_index = index
             break
     default_emotion = emotions[normal_index]["情绪"] if emotions else ""
     default_voice_id = emotions[normal_index]["voice_id"] if emotions else ""
     character_dict = selected.copy()
-    character_dict['情绪'] = default_emotion
-    character_dict['voice_id'] = default_voice_id
-    return selected["名称"], gr.Dropdown(choices=[emotion["情绪"] for emotion in emotions], value=default_emotion), character_dict, selected_characters
 async def update_prompt_audio(current_character):
     if current_character:
@@ -239,40 +339,102 @@ async def update_prompt_audio(current_character):
     else:
         return None
 head = """
 <title>Free Online Text to Speech (TTS) | Convert Text to Audio</title>
 <meta name="description" content="Text to Speech(TTS) for free! 5-second voice cloning, no sign-up required.">
 <meta name="keywords" content="text to speech, TTS, free TTS, online TTS, speech synthesis, voice generator">
 """
 with gr.Blocks(title="Online Free TTS", theme=gr.themes.Soft(), head=head) as demo:
     gr.Markdown(
         "Online Free TTS(Text-to-Speech). Ultra-low latency, 5-second voice cloning."
     )
-    lang = gr.Radio(choices=[("中文", "zh"), ("English", "en"), ("日本語", "ja"), ("한국인", "ko")], label=gettext("Language"), value="en", scale=1)
-    all_characters_state = gr.State(load_characters_csv("en"))
     with Translate(trans_file, lang, placeholder_langs=["en", "zh", "ja", "ko"]):
-        gr.Markdown(
-            value=gettext(header))
         with gr.Group():
-            initial_characters = get_characters(kind="原神", lang="zh", all_characters=all_characters_state.value)
             characters = gr.State(initial_characters)
             selected_characters = gr.State([])
             current_character = gr.State(None)
             with gr.Blocks():
                 with gr.Row():
                     # kind = gr.Dropdown(choices=["原神", "崩坏星穹铁道","鸣潮","明日方舟","其他"], value="原神", label="请选择角色类别")
-                    choices = [(gettext("Genshin Impact"),"原神"),
-                               (gettext("Honkai: Star Rail"),"崩坏星穹铁道"),
-                               (gettext("ZenZenless Zone Zero"),"绝区零"),
-                               (gettext("Wuthering Waves"),"鸣潮")]
-                    kind = gr.Dropdown(choices=choices, value="原神", label=gettext("Select character category"))
-                    query = gr.Textbox(label=gettext("Search character"), value="", lines=1, max_lines=1, interactive=True)
                 with gr.Blocks():
                     gallery = gr.Gallery(
-                        value=[[char['头像'], char['名称']] for char in characters.value],
                         show_label=False,
                         elem_id="character_gallery",
                         columns=[11],
@@ -280,34 +442,64 @@ with gr.Blocks(title="Online Free TTS", theme=gr.themes.Soft(), head=head) as de
                         height="auto",
                         interactive=False,
                         allow_preview=False,
-                        selected_index=None
                     )
                 with gr.Row():
-                    character_name = gr.Textbox(label=gettext("Currently selected character"), interactive=False, max_lines=1)
                     info_type = gr.Dropdown(choices=[], label=gettext("Select emotion"))
                 with gr.Row():
-                    add_voice_button = gr.Button(gettext("Add new voice"), variant="primary")
-                selected_chars_container = gr.Column(elem_id="selected_chars_container", visible=False)
                 with selected_chars_container:
                     gr.Markdown(gettext("### Selected characters"))
                     selected_chars_rows = []
                     for i in range(5):  # 假设最多选择5个角色
                         with gr.Row() as row:
-                            name = gr.Textbox(label=gettext("Name"), interactive=False, max_lines=1)
-                            emotion = gr.Textbox(label=gettext("Emotion"), interactive=False, max_lines=1)
                             delete_btn = gr.Button(gettext("Delete"), scale=0)
                         selected_chars_rows.append((name, emotion, delete_btn, row))
             with gr.Row():
                 with gr.Column():
-                    text = gr.Textbox(label=gettext("Text to synthesize"), value="", lines=10, max_lines=10)
-                    inference_button = gr.Button(gettext("🎉 Synthesize Voice 🎉"), variant="primary", size='lg')
                 with gr.Column():
-                    prompt_audio = gr.Audio(label=gettext("Reference audio for synthesis"), interactive=False, type="numpy")
-                    output = gr.Audio(label=gettext("Output audio"), interactive=False, type="numpy")
-                    cost_time = gr.Textbox(label=gettext("Synthesis time"), interactive=False, show_label=False, max_lines=1)
             try:
                 inference_button.click(
                     fn=generate,
@@ -319,74 +511,119 @@ with gr.Blocks(title="Online Free TTS", theme=gr.themes.Soft(), head=head) as de
             except Exception as e:
                 pass
-            # -------------- 绑定事件 --------------
-            lang.change(
-                fn=update_all_characters,
-                inputs=[lang, all_characters_state],
-                outputs=[all_characters_state, characters, gallery]
-            )
-            add_voice_button.click(
-                fn=add_new_voice,
-                inputs=[current_character, selected_characters, kind, lang, all_characters_state],
-                outputs=[current_character, character_name, info_type, selected_characters,
-                        characters, gallery, selected_chars_container, all_characters_state]
             ).then(
                 fn=update_selected_chars_display,
                 inputs=[selected_characters],
-                outputs=[item for row in selected_chars_rows for item in row]
             )
-            gallery.select(
-                fn=on_select,
-                inputs=[characters, selected_characters, all_characters_state],
-                outputs=[character_name, info_type, current_character, selected_characters]
-            ).then(
-                fn=update_prompt_audio,
-                inputs=[current_character],
-                outputs=[prompt_audio]
-            )
-            info_type.change(
-                fn=update_character_info,
-                inputs=[character_name, info_type, current_character, all_characters_state],
-                outputs=[current_character, all_characters_state]
-            ).then(
-                fn=update_prompt_audio,
-                inputs=[current_character],
-                outputs=[prompt_audio]
-            )
-            for i, (_, _, delete_btn, _) in enumerate(selected_chars_rows):
-                delete_btn.click(
-                    fn=remove_character,
-                    inputs=[gr.Number(value=i, visible=False), selected_characters],
-                    outputs=[selected_characters, selected_chars_container]
-                ).then(
-                    fn=update_selected_chars_display,
-                    inputs=[selected_characters],
-                    outputs=[item for row in selected_chars_rows for item in row]
-                )
-            kind.change(
-                fn=update_gallery,
-                inputs=[kind, query, all_characters_state],
-                outputs=[characters, gallery, all_characters_state]
-            )
-            query.change(
-                fn=update_gallery,
-                inputs=[kind, query, all_characters_state],
-                outputs=[characters, gallery, all_characters_state]
-            )
-        gr.Markdown(gettext(terms))
-if __name__ == '__main__':
     demo.queue(default_concurrency_limit=None).launch(
-        # server_name="0.0.0.0",
-        # server_port=80,
         show_api=False
     )

 import time
 import os
 import logging
 import gradio as gr
+import numpy as np
 import pandas as pd
 from pypinyin import lazy_pinyin
+from i18n import gettext, Translate
+from api import generate_api, get_audio, generate_voice, load_characters_csv
 from utils import get_length
 # 翻译文件位置
+trans_file = os.path.join(os.path.dirname(__file__), "i18n", "translations.json")
 # 关闭aiohttp的DEBUG日志
+logging.getLogger("aiohttp").setLevel(logging.WARNING)
+# logging.getLogger("gradio").setLevel(logging.WARNING)
 # 带有时间的log
+logging.basicConfig(
+    level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s"
+)
+header = """header"""
 terms = "terms"
+def update_all_characters(lang, category):
+    new_characters, category = load_characters_csv(lang)
+    initial_characters = get_characters(kind=category[0], all_characters=new_characters)
+    return (
+        new_characters,
+        initial_characters,
+        gr.Gallery(
+            value=[[char["头像"], char["名称"]] for char in initial_characters],
+            show_label=False,
+            elem_id="character_gallery",
+            columns=[11],
+            object_fit="contain",
+            height="auto",
+            interactive=False,
+            allow_preview=False,
+            selected_index=None,
+        ),
+        category,
+        gr.update(choices=category, value=category[0])
+    )
+def get_characters(
+    query=None, page=1, per_page=400, kind="原神", lang="zh", all_characters=None
+):
     # 使用传入的 all_characters 参数
     filtered_characters = all_characters[all_characters["类别"] == kind]
     if query:
         # 使用拼音和汉字进行搜索
         filtered_characters = filtered_characters[
+            filtered_characters["名称"].str.contains(query, case=False)
         ]
+        if filtered_characters.empty and lang == "zh":
             filtered_characters = all_characters[all_characters["类别"] == kind]
             filtered_characters = filtered_characters[
+                filtered_characters["名称"]
+                .apply(lambda x: "".join(lazy_pinyin(x)))
+                .str.contains(query, case=False)
             ]
     # 按名称分组，并选择每组的第一个记录
+    unique_characters = (
+        filtered_characters.groupby("名称").first().reset_index().sort_values(by="id")
+    )
+    # 处理头像数据
+    import pickle
+    def process_avatar(avatar):
+        if not isinstance(avatar, str):
+            try:
+                return pickle.loads(bytes(avatar))
+            except:
+                return avatar
+        return avatar
+    unique_characters['头像'] = unique_characters['头像'].apply(process_avatar)
     # 应用分页
     start_index = (page - 1) * per_page
     end_index = start_index + per_page
+    return unique_characters.iloc[start_index:end_index].to_dict("records")
+async def generate(selected_character=None, selected_characters=[], text="", lang="zh"):
     # print("-------",selected_character)
     # print("-------",selected_characters)
     if selected_character:
         elif lang == "ko":
             raise gr.Error("먼저 캐릭터를 선택하세요")
     voice_ids = [char.get("voice_id") for char in characters if char.get("voice_id")]
     if not voice_ids:
         raise gr.Error("所选角色没有关联的 voice_id")
     start_time = time.time()
     # 假设我们只使用第一个选择的角色的名称
     if voice_ids == "1":
             raise gr.Error("そのキャラクターの音声はまだ作成されていません")
         elif lang == "ko":
             raise gr.Error("해당 캐릭터의 음성이 아직 생성되지 않았습니다")
     if text == "":
         if lang == "zh":
             raise gr.Error("请输入需要合成的文本")
             raise gr.Error("合成するテキストを入力してください")
         elif lang == "ko":
             raise gr.Error("합성할 텍스트를 입력하세요")
     if get_length(text) > 1024:
         if lang == "zh":
             raise gr.Error("长度请控制在1024个字符以内")
             raise gr.Error("テキストの長さが1024文字を超えています")
         elif lang == "ko":
             raise gr.Error("텍스트 길이가 1024자를 초과합니다")
+    logging.info(
+        f"选择角色: {characters[0].get('名称')}, 文本: {text}, voice_id: {voice_ids}"
+    )
     audio = await generate_api(voice_ids, text)
     end_time = time.time()
     if lang == "zh":
         cost_time = f"合成共花费{end_time - start_time:.2f}秒"
     elif lang == "en":
+        cost_time = (
+            f"Total time spent synthesizing: {end_time - start_time:.2f} seconds"
+        )
     elif lang == "ja":
         cost_time = f"合成にかかった時間: {end_time - start_time:.2f}秒"
     elif lang == "ko":
     else:
         return audio, cost_time
 def get_character_emotions(character, all_characters):
     # 从all_characters中筛选出与当前角色名称相同的所有记录
+    character_records = all_characters[all_characters["名称"] == character["名称"]]
     # 按情绪去重并获取完整的角色信息
+    character_infos = character_records.drop_duplicates(subset=["情绪"]).to_dict(
+        "records"
+    )
     # 如果没有找到角色信息，返回一个包含默认值的字典
+    return (
+        character_infos
+        if character_infos
+        else [{"名称": character["名称"], "情绪": "默认情绪"}]
+    )
 def update_character_info(character_name, emotion, current_character, all_characters):
     character_info = None
     if character_name and emotion:
+        character_info = all_characters[
+            (all_characters["名称"] == character_name)
+            & (all_characters["情绪"] == emotion)
+        ]
     if character_name == "":
         return None
     character_info = character_info.iloc[0].to_dict()
     return character_info, all_characters
 def add_new_voice(current_character, selected_characters, kind, lang, all_characters):
     if not current_character:
         if lang == "zh":
             raise gr.Error("まず、キャラクターを選択してください")
         elif lang == "ko":
             raise gr.Error("먼저 캐릭터를 선택하세요")
     if len(selected_characters) >= 5:
         raise gr.Error("已达到最大选择数（5个）")
     # 检查是否已存在相同角色
+    existing_char = next(
+        (
+            char
+            for char in selected_characters
+            if char["名称"] == current_character["名称"]
+        ),
+        None,
+    )
     if existing_char:
         # 如果情绪不同,更新情绪
+        if existing_char["情绪"] != current_character["情绪"]:
+            existing_char["情绪"] = current_character["情绪"]
     else:
         selected_characters.insert(0, current_character)
+    updated_characters = get_characters(
+        kind=kind, lang=lang, all_characters=all_characters
+    )
     # ! 取消gallery选中状态,返回个新的gallery是必要的，否则会保留上一次的选中状态。这里sonnet很喜欢改成返回一个数组，但这不能清空gallery的选中状态
+    updated_gallery = gr.Gallery(
+        value=[[char["头像"], char["名称"]] for char in updated_characters],
+        show_label=False,
+        elem_id="character_gallery",
+        columns=[11],
+        object_fit="contain",
+        height="auto",
+        interactive=False,
+        allow_preview=False,
+        selected_index=None,
+    )
+    return (
+        None,
+        gr.update(value=""),
+        gr.update(choices=[]),
+        selected_characters,
+        updated_characters,
+        updated_gallery,
+        gr.update(visible=True),
+        all_characters,
+    )
 def update_selected_chars_display(selected_characters):
     updates = []
     for i, (name, emotion, _, row) in enumerate(selected_chars_rows):
         if i < len(selected_characters):
             char = selected_characters[i]
+            updates.extend(
+                [
+                    gr.update(value=char["名称"], visible=True),
+                    gr.update(value=char["情绪"], visible=True),
+                    gr.update(visible=True),
+                    gr.update(visible=True),
+                ]
+            )
         else:
+            updates.extend(
+                [
+                    gr.update(value="", visible=False),
+                    gr.update(value="", visible=False),
+                    gr.update(visible=False),
+                    gr.update(visible=False),
+                ]
+            )
     return updates
 def remove_character(index, selected_characters):
     if 0 <= index < len(selected_characters):
+        del selected_characters[index]
     return selected_characters, gr.update(visible=True)
 def update_gallery(kind, query, all_characters):
+    updated_characters = get_characters(
+        kind=kind, query=query, lang=lang, all_characters=all_characters
+    )
+    return (
+        updated_characters,
+        [[char["头像"], char["名称"]] for char in updated_characters],
+        all_characters,
+    )
 def on_select(evt: gr.SelectData, characters, selected_characters, all_characters):
     # 如果没有选择角色，换人的时候清空
     if len(selected_characters) == 0:
         selected_characters = []
     selected = characters[evt.index]
     emotions = get_character_emotions(selected, all_characters)
     normal_index = 0
     for index, emotion in enumerate(emotions):
+        if (
+            emotion["情绪"] == "正常"
+            or emotion["情绪"] == "보통"
+            or emotion["情绪"] == "normal"
+        ):
             normal_index = index
             break
     default_emotion = emotions[normal_index]["情绪"] if emotions else ""
     default_voice_id = emotions[normal_index]["voice_id"] if emotions else ""
     character_dict = selected.copy()
+    character_dict["情绪"] = default_emotion
+    character_dict["voice_id"] = default_voice_id
+    return (
+        selected["名称"],
+        gr.Dropdown(
+            choices=[emotion["情绪"] for emotion in emotions], value=default_emotion
+        ),
+        character_dict,
+        selected_characters,
+    )
 async def update_prompt_audio(current_character):
     if current_character:
     else:
         return None
+async def create_voice(avatar, name, emotion, tags, gender, audio_data, lang):
+    updates = {}
+    for field, value in [("avatar", avatar), ("name", name), ("emotion", emotion), ("tags", tags), ("gender", gender), ("audio_data", audio_data)]:
+        if field in ["avatar", "audio_data"]:
+            if value is None or (isinstance(value, np.ndarray) and value.size == 0):
+                updates[field] = gr.update(value=None)
+        elif value == "":
+            updates[field] = gr.update(value="")
+    if updates:
+        if lang == "zh":
+            gr.Warning("请填写完整信息")
+        elif lang == "en":
+            gr.Warning("Please fill in all the information")
+        elif lang == "ja":
+            gr.Warning("すべての情報を入力してください")
+        elif lang == "ko":
+            gr.Warning("모든 정보를 입력하세요")
+        return tuple(updates.get(field, gr.update()) for field in ["avatar", "name", "emotion", "tags", "gender", "audio_data"])
+    duration = len(audio_data[1]) / audio_data[0]
+    if duration < 3.2 or duration > 8:
+        if lang == "zh":
+            gr.Warning("音频时长请控制在3.2-8秒之间")
+        elif lang == "en":
+            gr.Warning("The audio duration should be between 3.2 and 8 seconds")
+        elif lang == "ja":
+            gr.Warning("音声の長さは3.2秒から8秒の間にしてください")
+        elif lang == "ko":
+            gr.Warning("음성 길이는 3.2초에서 8초 사이로 설정해야 합니다")
+        return avatar, name, emotion, tags, gender, audio_data
+    await generate_voice(avatar, name, emotion, tags, gender, audio_data, lang)
+    if lang == "zh":
+        gr.Info("创建成功")
+    elif lang == "en":
+        gr.Info("Create successfully")
+    elif lang == "ja":
+        gr.Info("作成に成功しました")
+    elif lang == "ko":
+        gr.Info("생성 성공")
+    return avatar, name, emotion, tags, gender, audio_data
 head = """
 <title>Free Online Text to Speech (TTS) | Convert Text to Audio</title>
 <meta name="description" content="Text to Speech(TTS) for free! 5-second voice cloning, no sign-up required.">
 <meta name="keywords" content="text to speech, TTS, free TTS, online TTS, speech synthesis, voice generator">
 """
 with gr.Blocks(title="Online Free TTS", theme=gr.themes.Soft(), head=head) as demo:
     gr.Markdown(
         "Online Free TTS(Text-to-Speech). Ultra-low latency, 5-second voice cloning."
     )
+    lang = gr.Radio(
+        choices=[("中文", "zh"), ("English", "en"), ("日本語", "ja"), ("한국인", "ko")],
+        label=gettext("Language"),
+        value="en",
+        scale=1,
+    )
+    all_characters_state = gr.State(load_characters_csv("en")[0])
+    category = gr.State(load_characters_csv("en")[1])
     with Translate(trans_file, lang, placeholder_langs=["en", "zh", "ja", "ko"]):
+        gr.Markdown(value=gettext(header))
         with gr.Group():
+            initial_characters = get_characters(
+                kind="原神", lang="zh", all_characters=all_characters_state.value
+            )
             characters = gr.State(initial_characters)
             selected_characters = gr.State([])
             current_character = gr.State(None)
+        with gr.Tab(gettext("Synthesis Voice")):
             with gr.Blocks():
                 with gr.Row():
                     # kind = gr.Dropdown(choices=["原神", "崩坏星穹铁道","鸣潮","明日方舟","其他"], value="原神", label="请选择角色类别")
+                    # choices = [
+                    #     (gettext("Genshin Impact"), "原神"),
+                    #     (gettext("Honkai: Star Rail"), "崩坏星穹铁道"),
+                    #     (gettext("ZenZenless Zone Zero"), "绝区零"),
+                    #     (gettext("Wuthering Waves"), "鸣潮"),
+                    # ]
+                    kind = gr.Dropdown(
+                        choices=category.value,
+                        value="原神",
+                        label=gettext("Select character category"),
+                    )
+                    query = gr.Textbox(
+                        label=gettext("Search character"),
+                        value="",
+                        lines=1,
+                        max_lines=1,
+                        interactive=True,
+                    )
                 with gr.Blocks():
                     gallery = gr.Gallery(
+                        value=[
+                            [char["头像"], char["名称"]] for char in characters.value
+                        ],
                         show_label=False,
                         elem_id="character_gallery",
                         columns=[11],
                         height="auto",
                         interactive=False,
                         allow_preview=False,
+                        selected_index=None,
                     )
                 with gr.Row():
+                    character_name = gr.Textbox(
+                        label=gettext("Currently selected character"),
+                        interactive=False,
+                        max_lines=1,
+                    )
                     info_type = gr.Dropdown(choices=[], label=gettext("Select emotion"))
                 with gr.Row():
+                    add_voice_button = gr.Button(
+                        gettext("Add new voice"), variant="primary"
+                    )
+                selected_chars_container = gr.Column(
+                    elem_id="selected_chars_container", visible=False
+                )
                 with selected_chars_container:
                     gr.Markdown(gettext("### Selected characters"))
                     selected_chars_rows = []
                     for i in range(5):  # 假设最多选择5个角色
                         with gr.Row() as row:
+                            name = gr.Textbox(
+                                label=gettext("Name"), interactive=False, max_lines=1
+                            )
+                            emotion = gr.Textbox(
+                                label=gettext("Emotion"), interactive=False, max_lines=1
+                            )
                             delete_btn = gr.Button(gettext("Delete"), scale=0)
                         selected_chars_rows.append((name, emotion, delete_btn, row))
             with gr.Row():
                 with gr.Column():
+                    text = gr.Textbox(
+                        label=gettext("Text to synthesize"),
+                        value="",
+                        lines=10,
+                        max_lines=10,
+                    )
+                    inference_button = gr.Button(
+                        gettext("🎉 Synthesize Voice 🎉"), variant="primary", size="lg"
+                    )
                 with gr.Column():
+                    prompt_audio = gr.Audio(
+                        label=gettext("Reference audio for synthesis"),
+                        interactive=False,
+                        type="numpy",
+                    )
+                    output = gr.Audio(
+                        label=gettext("Output audio"), interactive=False, type="numpy"
+                    )
+                    cost_time = gr.Textbox(
+                        label=gettext("Synthesis time"),
+                        interactive=False,
+                        show_label=False,
+                        max_lines=1,
+                    )
             try:
                 inference_button.click(
                     fn=generate,
             except Exception as e:
                 pass
+        with gr.Tab(gettext("Create Voice")):
+            with gr.Row():
+                avatar = gr.Image(label=gettext("Avatar"), interactive=True, type="pil", image_mode="RGBA")
+                with gr.Column():
+                    with gr.Row():
+                        name = gr.Textbox(
+                            label=gettext("Name"), interactive=True, max_lines=1
+                        )
+                        emotion = gr.Textbox(
+                            label=gettext("Emotion\n(Happy, Sad, Angry)"), interactive=True, max_lines=1
+                        )
+                        tags = gr.Textbox(
+                            label=gettext("Tags\n(Genshin, Cute, Girl, Boy, etc.)"), interactive=True, max_lines=1
+                        )
+                        gender = gr.Dropdown(
+                            label=gettext("Gender"),
+                            choices=[
+                                (gettext("Male"), "male"),
+                                (gettext("Female"), "female"),
+                                (gettext("Non-Binary"), "non-binary"),
+                            ],
+                            interactive=True,
+                        )
+                    audio_data = gr.Audio(label=gettext("Prompt Audio(min 3.2s, max 8s)"), interactive=True)
+                    create_button = gr.Button(gettext("Create Voice"), variant="primary")
+            # gr.Examples(
+            #     examples=[
+            #         ["https://ttscdn.rubii.ai/public/tts_avatars/原神/0491eeea-f82d-42dc-a6bf-b57e38e9c148.png", "Rubii", "开心", "原神", "female", (32000, np.zeros(10000)), lang],
+            #     ],
+            #     inputs=[avatar, name, emotion, tags, gender, audio_data],
+            # )
+        gr.Markdown(gettext(terms))
+        # -------------- 绑定事件 --------------
+        lang.change(
+            fn=update_all_characters,
+            inputs=[lang, category],
+            outputs=[all_characters_state, characters, gallery, category, kind],
+        )
+        add_voice_button.click(
+            fn=add_new_voice,
+            inputs=[
+                current_character,
+                selected_characters,
+                kind,
+                lang,
+                all_characters_state,
+            ],
+            outputs=[
+                current_character,
+                character_name,
+                info_type,
+                selected_characters,
+                characters,
+                gallery,
+                selected_chars_container,
+                all_characters_state,
+            ],
+        ).then(
+            fn=update_selected_chars_display,
+            inputs=[selected_characters],
+            outputs=[item for row in selected_chars_rows for item in row],
+        )
+        gallery.select(
+            fn=on_select,
+            inputs=[characters, selected_characters, all_characters_state],
+            outputs=[character_name, info_type, current_character, selected_characters],
+        ).then(
+            fn=update_prompt_audio, inputs=[current_character], outputs=[prompt_audio]
+        )
+        info_type.change(
+            fn=update_character_info,
+            inputs=[character_name, info_type, current_character, all_characters_state],
+            outputs=[current_character, all_characters_state],
+        ).then(
+            fn=update_prompt_audio, inputs=[current_character], outputs=[prompt_audio]
+        )
+        for i, (_, _, delete_btn, _) in enumerate(selected_chars_rows):
+            delete_btn.click(
+                fn=remove_character,
+                inputs=[gr.Number(value=i, visible=False), selected_characters],
+                outputs=[selected_characters, selected_chars_container],
             ).then(
                 fn=update_selected_chars_display,
                 inputs=[selected_characters],
+                outputs=[item for row in selected_chars_rows for item in row],
             )
+        kind.change(
+            fn=update_gallery,
+            inputs=[kind, query, all_characters_state],
+            outputs=[characters, gallery, all_characters_state],
+        )
+        query.change(
+            fn=update_gallery,
+            inputs=[kind, query, all_characters_state],
+            outputs=[characters, gallery, all_characters_state],
+        )
+        create_button.click(
+            fn=create_voice,
+            inputs=[avatar, name, emotion, tags, gender, audio_data, lang],
+            outputs=[avatar, name, emotion, tags, gender, audio_data],
+        )
+if __name__ == "__main__":
     demo.queue(default_concurrency_limit=None).launch(
         show_api=False
     )

i18n/characters_en.csv DELETED Viewed

The diff for this file is too large to render. See raw diff

i18n/characters_ja.csv DELETED Viewed

The diff for this file is too large to render. See raw diff

i18n/characters_ko.csv DELETED Viewed

The diff for this file is too large to render. See raw diff

i18n/characters_zh.csv DELETED Viewed

The diff for this file is too large to render. See raw diff

i18n/translations.json CHANGED Viewed

@@ -20,6 +20,16 @@
     "Reference audio for synthesis": "Reference audio for synthesis",
     "Output audio": "Output audio",
     "Synthesis time": "Synthesis time",
     "terms": "### **[Technical discussions, problem-solving, casual chats - welcome to our Discord](https://discord.gg/DyECTyqhkC)**\n\n ## Disclaimer\n\nThe voice synthesis service provided by this website (hereinafter referred to as the \"Service\") is intended for personal use and entertainment purposes. Before using this Service, please carefully read and fully understand the following terms:\n\n1. **Character Copyright**: The character images used on this website may involve third-party intellectual property rights. This website does not own the copyrights to these characters. Users should respect the intellectual property rights of the relevant characters when using the Service and ensure that their actions do not infringe upon any third-party intellectual property rights.\n\n2. **User-Generated Content (UGC)**: The voice content generated by users through this platform (hereinafter referred to as \"UGC\") is the sole responsibility of the users and is not related to this platform. This platform cannot control or review the specific content generated by users and does not assume any responsibility for the accuracy, completeness, or legality of UGC.\n\n3. **Usage Restrictions**: The voices and their UGC generated by this Service are limited to personal use only and may not be used for any commercial purposes. It is prohibited to use the generated content for any commercial activities without prior written consent from this platform.\n\n4. **Legal Responsibility**: Any legal responsibility arising from the use of this Service by users shall be borne by the users themselves and is not related to this platform. This platform does not assume any responsibility for any disputes or losses caused by users' use of the Service or their UGC.\n\n5. **Copyright Statement**: Users should respect original creations and must not use this Service to generate content that infringes upon others' copyrights. If user-generated content is found to infringe upon others' copyrights, this platform reserves the right to immediately cease providing services to them and reserves the right to pursue legal action.\n\n6. **Content Moderation**: Although this platform cannot control UGC, once content that violates this disclaimer or laws and regulations is discovered, this platform will take necessary measures, including but not limited to deleting the violating content and cooperating with relevant authorities in investigations.\n\n7. **Attribution Requirement**: Users should, where possible, prominently indicate \"This content was generated by AI and this website \" or a similar statement in the generated content. Users should ensure that the attribution complies with the requirements of these terms.\n\n By using this website, users agree to the above disclaimer. If you have any questions, please contact us at contact@yomio.ai.\n\n**The final interpretation right belongs to this website.**"
   },
   "zh": {
@@ -43,6 +53,16 @@
     "Reference audio for synthesis": "当前使用的参考音频",
     "Output audio": "输出的语音",
     "Synthesis time": "合成时间",
     "terms": "### **[技术讨论，有任何问题，或闲聊交友？欢迎加入我们的Discord](https://discord.gg/DyECTyqhkC)**\n\n ## 免责声明\n\n本网站提供的语音合成服务（以下简称\"服务\"）仅供个人使用和娱乐目的。在使用本服务之前，请仔细阅读并充分理解以下条款：\n\n1. **角色版权**：本网站使用的角色图像可能涉及第三方知识产权。本网站不拥有这些角色的版权。用户在使用服务时应尊重相关角色的知识产权，并确保其行为不侵犯任何第三方知识产权。\n\n2. **用户生成内容（UGC）**：用户通过本平台生成的语音内容（以下简称\"UGC\"）由用户自行负责，与本平台无关。本平台无法控制或审核用户生成的具体内容，不对UGC的准确性、完整性或合法性承担任何责任。\n\n3. **使用限制**：本服务生成的语音及其UGC仅��个人使用，不得用于任何商业目的。未经本平台事先书面同意，禁止将生成的内容用于任何商业活动。\n\n4. **法律责任**：用户使用本服务所产生的任何法律责任由用户自行承担，与本平台无关。本平台不对用户使用服务或其UGC造成的任何纠纷或损失承担任何责任。\n\n5. **版权声明**：用户应尊重原创作品，不得使用本服务生成侵犯他人版权的内容。如发现用户生成的内容侵犯他人版权，本平台保留立即停止向其提供服务的权利，并保留追究法律责任的权利。\n\n6. **内容审核**：尽管本平台无法控制UGC，但一旦发现违反本免责声明或法律法规的内容，本平台将采取必要措施，包括但不限于删除违规内容，并配合相关部门调查。\n\n7. **归属要求**：用户应在可能的情况下，在生成的内容中标明\"本内容由AI和本网站生成\"或类似声明。用户应确保归属符合这些条款的要求。\n\n 使用本网站即表示用户同意上述免责声明。如有任何疑问，请联系我们：contact@yomio.ai。\n\n**本网站拥有最终解释权。**"
   },
   "ja": {
@@ -66,6 +86,16 @@
     "Reference audio for synthesis": "合成に使用する参考音声",
     "Output audio": "出力された音声",
     "Synthesis time": "合成時間",
     "terms": "### **[技術的な議論、問題解決、カジュアルなチャットはDiscordへようこそ](https://discord.gg/DyECTyqhkC)**\n\n ## 免責事項\n\nこのウェブサイトが提供する音声合成サービス（以下「本サービス」）は、個人使用および娯楽目的のためのものです。本サービスを使用する前に、以下の条項を注意深く読み、十分に理解してください：\n\n1. **キャラクターの著作権**：このウェブサイトで使用されているキャラクター画像は、第三者の知的財産権を含む場合があります。このウェブサイトはこれらのキャラクターの著作権を所有していません。ユーザーは本サービスを使用する際、関連するキャラクターの知的財産権を尊重し、第三者の知的財産権を侵害しないよう行動する必要があります。\n\n2. **ユーザー生成コンテンツ（UGC）**：このプラットフォームを通じてユーザーが生成した音声コンテンツ（以下「UGC」）は、ユーザー自身の責任であり、このプラットフォームとは関係ありません。このプラットフォームはユーザーが生成した具体的なコンテンツを制御または審査することはできず、UGCの正確性、完全性、または合法性について一切の責任を負いません。\n\n3. **使用制限**：本サービスで生成された音声およびそのUGCは個人使用に限定され、商業目的で使用することはできません。このプラットフォームの事前の書面による同意なしに、生成されたコンテンツを商業活動に使用することは禁止されています。\n\n4. **法的責任**：ユーザーが本サービスを使用することによって生じるいかなる法的責任も、ユーザー自身が負うものとし、このプラットフォームとは関係ありません。このプラットフォームは、ユーザーのサービス使用またはUGCによって引き起こされた紛争や損失について一切の責任を負いません。\n\n5. **著作権声明**：ユーザーは原作を尊重し、他者の著作権を侵害するコンテンツを生成するために本サービスを使用してはいけません。ユーザーが生成したコンテンツが他者の著作権を侵害していることが判明した場合、このプラットフォームは直ちにサービス提供を停止する権利を留保し、法的措置を講じる権利を留保します。\n\n6. **コンテンツモデレーション**：このプラットフォームはUGCを制御できませんが、この免責事項や法律・規制に違反するコンテンツが発見された場合、このプラットフォームは必要な措置を講じます。これには違反コンテンツの削除や、関連当局の調査への協力が含まれますが、これらに限定されません。\n\n7. **帰属要件**：ユーザーは可能な限り、生成されたコンテンツに「このコンテンツはAIとこのウェブサイトによって生成されました」または類似の声明を目立つように表示する必要があります。ユーザーは帰属表示がこれらの条項の要件に準拠していることを確認する必要があります。\n\n このウェブサイトを使用することにより、ユーザーは上記の免責事項に同意したものとみなされます。ご質問がある場合は、contact@yomio.aiまでお問い合わせください。\n\n**最終的な解釈権はこのウェブサイトに帰属します。**"
   },
   "ko": {
@@ -89,6 +119,16 @@
     "Reference audio for synthesis": "합성에 사용되는 참조 오디오",
     "Output audio": "출력된 음성",
     "Synthesis time": "합성 시간",
     "terms": "### **[기술 토론, 문제 해결, 일상 대화 - 우리의 Discord에 오신 것을 환영합니다](https://discord.gg/DyECTyqhkC)**\n\n ## 면책 조항\n\n이 웹사이트가 제공하는 음성 합성 서비스(이하 \"서비스\")는 개인 사용 및 엔터테인먼트 목적으로 제공됩니다. 이 서비스를 사용하기 전에 다음 조항을 주의 깊게 읽고 완전히 이해해 주시기 바랍니다:\n\n1. **캐릭터 저작권**: 이 웹사이트에서 사용되는 캐릭터 이미지는 제3자의 지적 재산권과 관련될 수 있습니다. 이 웹사이트는 이러한 캐릭터들의 저작권을 소유하고 있지 않습니다. 사용자는 서비스를 사용할 때 관련 캐릭터의 지적 재산권을 존중하고 제3자의 지적 재산권을 침해하지 않도록 해야 합니다.\n\n2. **사용자 생성 콘텐츠(UGC)**: 이 플랫폼을 통해 사용자가 생성한 음성 콘텐츠(이하 \"UGC\")는 사용자의 단독 책임이며 이 플랫폼과는 관련이 없습니다. 이 플랫폼은 사용자가 생성한 특정 콘텐츠를 통제하거나 검토할 수 없으며 UGC의 정확성, 완전성 또는 합법성에 대해 어떠한 책임도 지지 않습니다.\n\n3. **사용 제한**: 이 서비스로 생성된 음성과 그 UGC는 개인 사용으로만 제한되며 상업적 목적으로 사용될 수 없습니다. 이 플랫폼의 사전 서면 동의 없이 생성된 콘텐츠를 상업적 활동에 사용하는 것은 금지됩니다.\n\n4. **법적 책임**: 사용자가 이 서비스를 사용함으로써 발생하는 모든 법적 책임은 사용자 자신이 부담하며 이 플랫폼과는 관련이 없습니다. 이 플랫폼은 사용자의 서비스 사용 또는 UGC로 인해 발생하는 어떠한 분쟁이나 손실에 대해서도 책임을 지지 않습니다.\n\n5. **저작권 성명**: 사용자는 원작을 존중해야 하며 이 서비스를 사용하여 타인의 저작권을 침해하는 콘텐츠를 생성해서는 안 됩니다. 사용자가 생성한 콘텐츠가 타인의 저작권을 침해한 것으로 밝혀진 경우, 이 플랫폼은 즉시 서비스 제공을 중단할 권리를 보유하며 법적 조치를 취할 권리를 보유합니다.\n\n6. **콘텐츠 관리**: 이 플랫폼은 UGC를 통제할 수 없지만, 이 면책 조항이나 법률 및 규정을 위반하는 콘텐츠가 발견되면 이 플랫폼은 필요한 조치를 취할 것입니다. 여기에는 위반 콘텐츠 삭제 및 관련 당국의 조사에 협조하는 것이 포함되지만 이에 국한되지 않습니다.\n\n7. **귀속 요구 사항**: 사용자는 가능한 한 생성된 콘텐츠에 \"이 콘텐츠는 AI와 이 웹사이트에 의해 생성되었습니다\" 또는 유사한 문구를 눈에 띄게 표시해야 합니다. 사용자는 귀속 표시가 이 약관의 요구 사항을 준수하는지 확인해야 합니다.\n\n 이 웹사이트를 사용함으로써 사용자는 위의 면책 조항에 동의하는 것으로 간주됩니다. 질문이 있으시면 contact@yomio.ai로 문의해 주시기 바랍니다.\n\n**최종 해석권은 이 웹사이트에 있습니다.**"
   }
 }

     "Reference audio for synthesis": "Reference audio for synthesis",
     "Output audio": "Output audio",
     "Synthesis time": "Synthesis time",
+    "Synthesis Voice": "Synthesis Voice",
+    "Avatar": "Avatar",
+    "Emotion\n(Happy, Sad, Angry)": "Emotion\n(Happy, Sad, Angry)",
+    "Tags\n(Genshin, Cute, Girl, Boy, etc.)": "Tags\n(Genshin, Cute, Girl, Boy, etc.)",
+    "Male": "Male",
+    "Female": "Female",
+    "Non-Binary": "Non-Binary",
+    "Gender": "Gender",
+    "Prompt Audio(min 3.2s, max 8s)": "Prompt Audio(min 3.2s, max 8s)",
+    "Create Voice": "Create Voice",
     "terms": "### **[Technical discussions, problem-solving, casual chats - welcome to our Discord](https://discord.gg/DyECTyqhkC)**\n\n ## Disclaimer\n\nThe voice synthesis service provided by this website (hereinafter referred to as the \"Service\") is intended for personal use and entertainment purposes. Before using this Service, please carefully read and fully understand the following terms:\n\n1. **Character Copyright**: The character images used on this website may involve third-party intellectual property rights. This website does not own the copyrights to these characters. Users should respect the intellectual property rights of the relevant characters when using the Service and ensure that their actions do not infringe upon any third-party intellectual property rights.\n\n2. **User-Generated Content (UGC)**: The voice content generated by users through this platform (hereinafter referred to as \"UGC\") is the sole responsibility of the users and is not related to this platform. This platform cannot control or review the specific content generated by users and does not assume any responsibility for the accuracy, completeness, or legality of UGC.\n\n3. **Usage Restrictions**: The voices and their UGC generated by this Service are limited to personal use only and may not be used for any commercial purposes. It is prohibited to use the generated content for any commercial activities without prior written consent from this platform.\n\n4. **Legal Responsibility**: Any legal responsibility arising from the use of this Service by users shall be borne by the users themselves and is not related to this platform. This platform does not assume any responsibility for any disputes or losses caused by users' use of the Service or their UGC.\n\n5. **Copyright Statement**: Users should respect original creations and must not use this Service to generate content that infringes upon others' copyrights. If user-generated content is found to infringe upon others' copyrights, this platform reserves the right to immediately cease providing services to them and reserves the right to pursue legal action.\n\n6. **Content Moderation**: Although this platform cannot control UGC, once content that violates this disclaimer or laws and regulations is discovered, this platform will take necessary measures, including but not limited to deleting the violating content and cooperating with relevant authorities in investigations.\n\n7. **Attribution Requirement**: Users should, where possible, prominently indicate \"This content was generated by AI and this website \" or a similar statement in the generated content. Users should ensure that the attribution complies with the requirements of these terms.\n\n By using this website, users agree to the above disclaimer. If you have any questions, please contact us at contact@yomio.ai.\n\n**The final interpretation right belongs to this website.**"
   },
   "zh": {
     "Reference audio for synthesis": "当前使用的参考音频",
     "Output audio": "输出的语音",
     "Synthesis time": "合成时间",
+    "Synthesis Voice": "合成语音",
+    "Avatar": "头像",
+    "Emotion\n(Happy, Sad, Angry)": "情绪\n（快乐、悲伤、愤怒）",
+    "Tags\n(Genshin, Cute, Girl, Boy, etc.)": "标签\n（原神、可爱、少女、正太等）",
+    "Male": "男性",
+    "Female": "女性",
+    "Non-Binary": "非二元性别",
+    "Gender": "性别",
+    "Prompt Audio(min 3.2s, max 8s)": "提示音频（最短3.2秒，最长8秒）",
+    "Create Voice": "创建语音",
     "terms": "### **[技术讨论，有任何问题，或闲聊交友？欢迎加入我们的Discord](https://discord.gg/DyECTyqhkC)**\n\n ## 免责声明\n\n本网站提供的语音合成服务（以下简称\"服务\"）仅供个人使用和娱乐目的。在使用本服务之前，请仔细阅读并充分理解以下条款：\n\n1. **角色版权**：本网站使用的角色图像可能涉及第三方知识产权。本网站不拥有这些角色的版权。用户在使用服务时应尊重相关角色的知识产权，并确保其行为不侵犯任何第三方知识产权。\n\n2. **用户生成内容（UGC）**：用户通过本平台生成的语音内容（以下简称\"UGC\"）由用户自行负责，与本平台无关。本平台无法控制或审核用户生成的具体内容，不对UGC的准确性、完整性或合法性承担任何责任。\n\n3. **使用限制**：本服务生成的语音及其UGC仅��个人使用，不得用于任何商业目的。未经本平台事先书面同意，禁止将生成的内容用于任何商业活动。\n\n4. **法律责任**：用户使用本服务所产生的任何法律责任由用户自行承担，与本平台无关。本平台不对用户使用服务或其UGC造成的任何纠纷或损失承担任何责任。\n\n5. **版权声明**：用户应尊重原创作品，不得使用本服务生成侵犯他人版权的内容。如发现用户生成的内容侵犯他人版权，本平台保留立即停止向其提供服务的权利，并保留追究法律责任的权利。\n\n6. **内容审核**：尽管本平台无法控制UGC，但一旦发现违反本免责声明或法律法规的内容，本平台将采取必要措施，包括但不限于删除违规内容，并配合相关部门调查。\n\n7. **归属要求**：用户应在可能的情况下，在生成的内容中标明\"本内容由AI和本网站生成\"或类似声明。用户应确保归属符合这些条款的要求。\n\n 使用本网站即表示用户同意上述免责声明。如有任何疑问，请联系我们：contact@yomio.ai。\n\n**本网站拥有最终解释权。**"
   },
   "ja": {
     "Reference audio for synthesis": "合成に使用する参考音声",
     "Output audio": "出力された音声",
     "Synthesis time": "合成時間",
+    "Synthesis Voice": "音声合成",
+    "Avatar": "アバター",
+    "Emotion\n(Happy, Sad, Angry)": "感情\n（嬉しい、悲しい、怒り）",
+    "Tags\n(Genshin, Cute, Girl, Boy, etc.)": "タグ\n（原神、かわいい、女の子、男の子など）",
+    "Male": "男性",
+    "Female": "女性",
+    "Non-Binary": "ノンバイナリー",
+    "Gender": "性別",
+    "Prompt Audio(min 3.2s, max 8s)": "プロンプト音声（最小3.2秒、最大8秒）",
+    "Create Voice": "音声を作成",
     "terms": "### **[技術的な議論、問題解決、カジュアルなチャットはDiscordへようこそ](https://discord.gg/DyECTyqhkC)**\n\n ## 免責事項\n\nこのウェブサイトが提供する音声合成サービス（以下「本サービス」）は、個人使用および娯楽目的のためのものです。本サービスを使用する前に、以下の条項を注意深く読み、十分に理解してください：\n\n1. **キャラクターの著作権**：このウェブサイトで使用されているキャラクター画像は、第三者の知的財産権を含む場合があります。このウェブサイトはこれらのキャラクターの著作権を所有していません。ユーザーは本サービスを使用する際、関連するキャラクターの知的財産権を尊重し、第三者の知的財産権を侵害しないよう行動する必要があります。\n\n2. **ユーザー生成コンテンツ（UGC）**：このプラットフォームを通じてユーザーが生成した音声コンテンツ（以下「UGC」）は、ユーザー自身の責任であり、このプラットフォームとは関係ありません。このプラットフォームはユーザーが生成した具体的なコンテンツを制御または審査することはできず、UGCの正確性、完全性、または合法性について一切の責任を負いません。\n\n3. **使用制限**：本サービスで生成された音声およびそのUGCは個人使用に限定され、商業目的で使用することはできません。このプラットフォームの事前の書面による同意なしに、生成されたコンテンツを商業活動に使用することは禁止されています。\n\n4. **法的責任**：ユーザーが本サービスを使用することによって生じるいかなる法的責任も、ユーザー自身が負うものとし、このプラットフォームとは関係ありません。このプラットフォームは、ユーザーのサービス使用またはUGCによって引き起こされた紛争や損失について一切の責任を負いません。\n\n5. **著作権声明**：ユーザーは原作を尊重し、他者の著作権を侵害するコンテンツを生成するために本サービスを使用してはいけません。ユーザーが生成したコンテンツが他者の著作権を侵害していることが判明した場合、このプラットフォームは直ちにサービス提供を停止する権利を留保し、法的措置を講じる権利を留保します。\n\n6. **コンテンツモデレーション**：このプラットフォームはUGCを制御できませんが、この免責事項や法律・規制に違反するコンテンツが発見された場合、このプラットフォームは必要な措置を講じます。これには違反コンテンツの削除や、関連当局の調査への協力が含まれますが、これらに限定されません。\n\n7. **帰属要件**：ユーザーは可能な限り、生成されたコンテンツに「このコンテンツはAIとこのウェブサイトによって生成されました」または類似の声明を目立つように表示する必要があります。ユーザーは帰属表示がこれらの条項の要件に準拠していることを確認する必要があります。\n\n このウェブサイトを使用することにより、ユーザーは上記の免責事項に同意したものとみなされます。ご質問がある場合は、contact@yomio.aiまでお問い合わせください。\n\n**最終的な解釈権はこのウェブサイトに帰属します。**"
   },
   "ko": {
     "Reference audio for synthesis": "합성에 사용되는 참조 오디오",
     "Output audio": "출력된 음성",
     "Synthesis time": "합성 시간",
+    "Synthesis Voice": "음성 합성",
+    "Avatar": "아바타",
+    "Emotion\n(Happy, Sad, Angry)": "감정\n(행복, 슬픔, 화남)",
+    "Tags\n(Genshin, Cute, Girl, Boy, etc.)": "태그\n(원신, 귀여움, 소녀, 소년 등)",
+    "Male": "남성",
+    "Female": "여성",
+    "Non-Binary": "논바이너리",
+    "Gender": "성별",
+    "Prompt Audio(min 3.2s, max 8s)": "프롬프트 오디오(최소 3.2초, 최대 8초)",
+    "Create Voice": "음성 생성",
     "terms": "### **[기술 토론, 문제 해결, 일상 대화 - 우리의 Discord에 오신 것을 환영합니다](https://discord.gg/DyECTyqhkC)**\n\n ## 면책 조항\n\n이 웹사이트가 제공하는 음성 합성 서비스(이하 \"서비스\")는 개인 사용 및 엔터테인먼트 목적으로 제공됩니다. 이 서비스를 사용하기 전에 다음 조항을 주의 깊게 읽고 완전히 이해해 주시기 바랍니다:\n\n1. **캐릭터 저작권**: 이 웹사이트에서 사용되는 캐릭터 이미지는 제3자의 지적 재산권과 관련될 수 있습니다. 이 웹사이트는 이러한 캐릭터들의 저작권을 소유하고 있지 않습니다. 사용자는 서비스를 사용할 때 관련 캐릭터의 지적 재산권을 존중하고 제3자의 지적 재산권을 침해하지 않도록 해야 합니다.\n\n2. **사용자 생성 콘텐츠(UGC)**: 이 플랫폼을 통해 사용자가 생성한 음성 콘텐츠(이하 \"UGC\")는 사용자의 단독 책임이며 이 플랫폼과는 관련이 없습니다. 이 플랫폼은 사용자가 생성한 특정 콘텐츠를 통제하거나 검토할 수 없으며 UGC의 정확성, 완전성 또는 합법성에 대해 어떠한 책임도 지지 않습니다.\n\n3. **사용 제한**: 이 서비스로 생성된 음성과 그 UGC는 개인 사용으로만 제한되며 상업적 목적으로 사용될 수 없습니다. 이 플랫폼의 사전 서면 동의 없이 생성된 콘텐츠를 상업적 활동에 사용하는 것은 금지됩니다.\n\n4. **법적 책임**: 사용자가 이 서비스를 사용함으로써 발생하는 모든 법적 책임은 사용자 자신이 부담하며 이 플랫폼과는 관련이 없습니다. 이 플랫폼은 사용자의 서비스 사용 또는 UGC로 인해 발생하는 어떠한 분쟁이나 손실에 대해서도 책임을 지지 않습니다.\n\n5. **저작권 성명**: 사용자는 원작을 존중해야 하며 이 서비스를 사용하여 타인의 저작권을 침해하는 콘텐츠를 생성해서는 안 됩니다. 사용자가 생성한 콘텐츠가 타인의 저작권을 침해한 것으로 밝혀진 경우, 이 플랫폼은 즉시 서비스 제공을 중단할 권리를 보유하며 법적 조치를 취할 권리를 보유합니다.\n\n6. **콘텐츠 관리**: 이 플랫폼은 UGC를 통제할 수 없지만, 이 면책 조항이나 법률 및 규정을 위반하는 콘텐츠가 발견되면 이 플랫폼은 필요한 조치를 취할 것입니다. 여기에는 위반 콘텐츠 삭제 및 관련 당국의 조사에 협조하는 것이 포함되지만 이에 국한되지 않습니다.\n\n7. **귀속 요구 사항**: 사용자는 가능한 한 생성된 콘텐츠에 \"이 콘텐츠는 AI와 이 웹사이트에 의해 생성되었습니다\" 또는 유사한 문구를 눈에 띄게 표시해야 합니다. 사용자는 귀속 표시가 이 약관의 요구 사항을 준수하는지 확인해야 합니다.\n\n 이 웹사이트를 사용함으로써 사용자는 위의 면책 조항에 동의하는 것으로 간주됩니다. 질문이 있으시면 contact@yomio.ai로 문의해 주시기 바랍니다.\n\n**최종 해석권은 이 웹사이트에 있습니다.**"
   }
 }