Spaces:

SnJForever
/

GPT-LANG

Running

SnJForever commited on Apr 14, 2023

Commit

883bac9

•

1 Parent(s): 0a75ccd

add

Files changed (1) hide show

app.py CHANGED Viewed

@@ -59,8 +59,18 @@ def on_prompt_template_change(prompt_template):
     if not isinstance(prompt_template, str): return
     return prompt_templates[prompt_template]
 # UNCOMMENT TO USE WHISPER
-def transcribe(aud_inp, whisper_lang):
     if aud_inp is None:
         return ""
     text = WHISPER_MODEL.transcribe(aud_inp)
@@ -327,12 +337,12 @@ with gr.Blocks(css=css) as demo:
             with gr.Column(scale=3):
                 btn_submit = gr.Button("Submit")
                 total_tokens_str = gr.Markdown(elem_id="total_tokens_str")
         with gr.Row():
             btn_clear_conversation = gr.Button("🔃 Start New Conversation")
-        # with gr.Row():
-        #     audio_comp = gr.Microphone(source="microphone", type="filepath", label="Just say it!",
-        #                             interactive=True, streaming=False)
-        #     audio_comp.change(transcribe, inputs=[audio_comp, WHISPER_DETECT_LANG], outputs=[input_message])
     # gr.HTML('''<br><br><br><center>You can duplicate this Space to skip the queue:<a href="https://huggingface.co/spaces/anzorq/chatgpt-demo?duplicate=true"><img src="https://bit.ly/3gLdBN6" alt="Duplicate Space"></a><br>

     if not isinstance(prompt_template, str): return
     return prompt_templates[prompt_template]
+def lan_detector(audio_file):
+   print('reading the audio file')
+   audio = whisper.load_audio(audio_file)
+   audio = whisper.pad_or_trim(audio)
+   mel = whisper.log_mel_spectrogram(audio).to(WHISPER_MODEL.device)
+   _, probs = WHISPER_MODEL.detect_language(mel)
+   if max(probs, key=probs.get) == 'en':
+     return True
+   return False
 # UNCOMMENT TO USE WHISPER
+def transcribe(aud_inp):
     if aud_inp is None:
         return ""
     text = WHISPER_MODEL.transcribe(aud_inp)
             with gr.Column(scale=3):
                 btn_submit = gr.Button("Submit")
                 total_tokens_str = gr.Markdown(elem_id="total_tokens_str")
+        with gr.Row():
+            audio_comp = gr.Microphone(source="microphone", type="filepath", label="Just say it!",
+                                    interactive=True, streaming=False)
+            audio_comp.change(transcribe, inputs=[audio_comp], outputs=[input_message])
         with gr.Row():
             btn_clear_conversation = gr.Button("🔃 Start New Conversation")
     # gr.HTML('''<br><br><br><center>You can duplicate this Space to skip the queue:<a href="https://huggingface.co/spaces/anzorq/chatgpt-demo?duplicate=true"><img src="https://bit.ly/3gLdBN6" alt="Duplicate Space"></a><br>