Spaces:

Kalp97
/

KalpTranscript

Running

App Files Files Community

Kalp97 commited on 21 days ago

Commit

af4bef5

verified ·

1 Parent(s): 9645092

Upload app.py

Browse files

Files changed (1) hide show

app.py +31 -0

app.py CHANGED Viewed

@@ -295,6 +295,37 @@ by Kalpi Edition
                     download_btn = gr.Button("Save transcript", variant="secondary")
                     download_file = gr.File(label="")
     def run(file, model_raw, language, timestamps, translate):
         model_name = model_raw.split()[0].strip()
         return transcribe(file, model_name, language, timestamps, translate)

                     download_btn = gr.Button("Save transcript", variant="secondary")
                     download_file = gr.File(label="")
+    def transcribe(file, model_name, language, show_timestamps, translate):
+        if file is None:
+            return "⚠️ Please upload a file first.", ""
+        model = load_model(model_name)
+        lang = None if language == "Auto Detect" else language
+        task = "translate" if translate == "Translate to English" else "transcribe"
+        # Handle Hinglish — transcribe in Hindi then romanize output
+        if language == "Hinglish (Roman)":
+            lang = "hi"
+            result = model.transcribe(file.name, language=lang, task=task)
+            for seg in result["segments"]:
+                seg["text"] = devanagari_to_roman(seg["text"])
+            result["text"] = devanagari_to_roman(result["text"])
+        else:
+            result = model.transcribe(file.name, language=lang, task=task)
+        if show_timestamps:
+            lines = []
+            for seg in result["segments"]:
+                start = format_time(seg["start"])
+                end   = format_time(seg["end"])
+                lines.append(f"[{start} → {end}]  {seg['text'].strip()}")
+            transcript = "\n".join(lines)
+        else:
+            transcript = result["text"].strip()
+        return transcript, transcript
     def run(file, model_raw, language, timestamps, translate):
         model_name = model_raw.split()[0].strip()
         return transcribe(file, model_name, language, timestamps, translate)