Spaces:

Sakalti
/

Onsei-Tukuri

Sleeping

App Files Files Community

Sakalti commited on Apr 26

Commit

60b21a4

verified ·

1 Parent(s): cfb63ba

Create app.py

Browse files

Files changed (1) hide show

app.py +61 -0

app.py ADDED Viewed

	@@ -0,0 +1,61 @@

+import gradio as gr
+import pyttsx3
+import tempfile
+from pydub import AudioSegment
+# テンプレート設定
+TEMPLATES = {
+    "標準 (ピッチ1.0, 速度1.0)": (1.0, 1.0),
+    "パラオボール (高め, 少し速い)": (1.3, 1.2),
+    "ウサギモード (超高め, 超速い)": (2.0, 2.0),
+    "クマモード (低め, ゆっくり)": (0.8, 0.8),
+    "スローリーバード (普通ピッチ, めっちゃゆっくり)": (1.0, 0.5)
+}
+def change_pitch_speed(sound, pitch_factor=1.0, speed_factor=1.0):
+    new_sample_rate = int(sound.frame_rate * pitch_factor)
+    sound = sound._spawn(sound.raw_data, overrides={"frame_rate": new_sample_rate})
+    sound = sound.set_frame_rate(44100)
+    sound = sound.speedup(playback_speed=speed_factor)
+    return sound
+def read_text(text, template_name, custom_pitch, custom_speed, use_custom):
+    # テンプレート選択 or カスタム
+    if use_custom:
+        pitch = custom_pitch
+        speed = custom_speed
+    else:
+        pitch, speed = TEMPLATES.get(template_name, (1.0, 1.0))
+    # 音声合成
+    engine = pyttsx3.init()
+    with tempfile.NamedTemporaryFile(delete=False, suffix=".mp3") as fp:
+        tts_filename = fp.name
+    engine.save_to_file(text, tts_filename)
+    engine.runAndWait()
+    sound = AudioSegment.from_file(tts_filename)
+    modified_sound = change_pitch_speed(sound, pitch_factor=pitch, speed_factor=speed)
+    with tempfile.NamedTemporaryFile(delete=False, suffix=".mp3") as out_fp:
+        output_filename = out_fp.name
+    modified_sound.export(output_filename, format="mp3")
+    return output_filename
+# Gradioインターフェース
+iface = gr.Interface(
+    fn=read_text,
+    inputs=[
+        gr.Textbox(label="読み上げるテキスト"),
+        gr.Dropdown(choices=list(TEMPLATES.keys()), value="標準 (ピッチ1.0, 速度1.0)", label="テンプレートを選択"),
+        gr.Slider(minimum=0.5, maximum=3.0, step=0.05, value=1.0, label="カスタムピッチ（使う場合のみ）"),
+        gr.Slider(minimum=0.5, maximum=3.0, step=0.05, value=1.0, label="カスタム速度（使う場合のみ）"),
+        gr.Checkbox(label="カスタム設定を使う（オンなら上のスライダー反映）", value=False)
+    ],
+    outputs=gr.Audio(label="生成された音声"),
+    title="パラオボール声 読み上げ機 テンプレート版",
+    description="テンプレートを選ぶか、カスタムでピッチ・速度を指定して、自由に音声を作ろう！"
+)
+iface.launch()