Spaces:

yachimat
/

easy-whisper

Sleeping

yachimat commited on May 6

Commit

b060537

•

1 Parent(s): 4956c3c

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -16,7 +16,7 @@ AudioSegment.ffprobe = ffmpeg_path
 # OpenAIクライアントの初期化
 client = OpenAI()
-def process_audio(audio_file, info):
     output_format = info["出力フォーマットを選択"]
     audio_data = audio_file.read()
@@ -40,12 +40,17 @@ def process_audio(audio_file, info):
     # Initialize variables
     parts = []
     start_ms = 0
     while start_ms < duration_ms:
         # Calculate end of the part
         end_ms = min(start_ms + max_duration_per_part, duration_ms)
         part = audio[start_ms:end_ms]
         parts.append(part)
         start_ms = end_ms
     # Process each part and concatenate text results
     full_transcript = ""
@@ -72,16 +77,16 @@ def process_audio(audio_file, info):
         docx_buffer.seek(0)
         return docx_buffer.getvalue()
 iface = gr.Interface(
     fn=process_audio,
     inputs=[
         gr.Audio(type="filepath", label="音声ファイルをアップロード"),
         gr.Radio(choices=["テキスト", "Docx"], label="出力フォーマットを選択")
     ],
-    outputs=None,  # We'll dynamically define the outputs inside the function
     title="音声ファイルをテキストに変換",
-    description="このツールは音声ファイルをテキストに変換します。出力形式としてテキストまたはWord文書を選択できます。"
 )
-iface.launch()

 # OpenAIクライアントの初期化
 client = OpenAI()
+def process_audio(audio_file, info, progress):
     output_format = info["出力フォーマットを選択"]
     audio_data = audio_file.read()
     # Initialize variables
     parts = []
     start_ms = 0
+    total_parts = int(duration_ms / max_duration_per_part) + 1
+    part_index = 0
     while start_ms < duration_ms:
         # Calculate end of the part
         end_ms = min(start_ms + max_duration_per_part, duration_ms)
         part = audio[start_ms:end_ms]
         parts.append(part)
         start_ms = end_ms
+        part_index += 1
+        progress(part_index / total_parts)  # Update progress
     # Process each part and concatenate text results
     full_transcript = ""
         docx_buffer.seek(0)
         return docx_buffer.getvalue()
 iface = gr.Interface(
     fn=process_audio,
     inputs=[
         gr.Audio(type="filepath", label="音声ファイルをアップロード"),
         gr.Radio(choices=["テキスト", "Docx"], label="出力フォーマットを選択")
     ],
+    outputs="textbox",
     title="音声ファイルをテキストに変換",
+    description="このツールは音声ファイルをテキストに変換します。出力形式としてテキストまたはWord文書を選択できます。",
+    allow_flagging="never"
 )
+iface.launch()