Spaces:

camparchimedes
/

nb

Build error

App Files Files

camparchimedes commited on Aug 6

Commit

5e4096f

•

1 Parent(s): 877e925

Update app.py

Browse files

Files changed (1) hide show

app.py +8 -22

app.py CHANGED Viewed

@@ -15,14 +15,6 @@ processor = WhisperProcessor.from_pretrained("NbAiLabBeta/nb-whisper-medium")
 device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
 torch_dtype = torch.float32
-# Initialize pipeline
-#asr = pipeline("automatic-speech-recognition", model=model, tokenizer=processor.tokenizer, feature_extractor=processor.feature_extractor, device=device, torch_dtype=torch_dtype)
-#def transcribe_audio(audio_file):
-    #with torch.no_grad():
-        #output = asr(audio_file, chunk_length_s=28, generate_kwargs={"num_beams": 5, "task": "transcribe", "language": "no"})
-    #return output["text"]
 def transcribe_audio(audio_file):
     audio_input, _ = sf.read(audio_file)
     inputs = processor(audio_input, sampling_rate=16000, return_tensors="pt")
@@ -31,19 +23,17 @@ def transcribe_audio(audio_file):
         output = model.generate(
             inputs.input_features,
             max_length=448,
-            chunk_length_s=28,
             num_beams=5,
             task="transcribe",
             language="no"
         )
     transcription = processor.batch_decode(output, skip_special_tokens=True)[0]
     return transcription
-    #print(transcription)
 # HTML for banner image
 banner_html = """
 <div style="text-align: center;">
-    <img src="https://huggingface.co/spaces/camparchimedes/work_harder/raw/main/Olas%20AudioSwitch%20Shop.png" alt="Banner" width="87%; height:auto;">
 </div>
 """
@@ -52,16 +42,12 @@ iface = gr.Blocks()
 with iface:
     gr.HTML(banner_html)
-    gr.Interface(
-        fn=transcribe_audio,
-        inputs=gr.Audio(type="filepath"),
-        outputs="text",
-        title="Audio Transcription App",
-        description="Upload an audio file to get the transcription",
-        theme="default",
-        layout="vertical",
-        live=False
-    )
 # Launch the interface
-iface.launch(share=True, debug=True)

 device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
 torch_dtype = torch.float32
 def transcribe_audio(audio_file):
     audio_input, _ = sf.read(audio_file)
     inputs = processor(audio_input, sampling_rate=16000, return_tensors="pt")
         output = model.generate(
             inputs.input_features,
             max_length=448,
             num_beams=5,
             task="transcribe",
             language="no"
         )
     transcription = processor.batch_decode(output, skip_special_tokens=True)[0]
     return transcription
 # HTML for banner image
 banner_html = """
 <div style="text-align: center;">
+    <img src="https://huggingface.co/spaces/camparchimedes/ola_s-audioshop/raw/main/Olas%20AudioSwitch%20Shop.png" alt="Banner" width="87%; height:auto;">
 </div>
 """
 with iface:
     gr.HTML(banner_html)
+    gr.Markdown("# Audio Transcription App\nUpload an audio file to get the transcription")
+    audio_input = gr.Audio(type="filepath")
+    transcription_output = gr.Textbox()
+    transcribe_button = gr.Button("Transcribe")
+    transcribe_button.click(fn=transcribe_audio, inputs=audio_input, outputs=transcription_output)
 # Launch the interface
+iface.launch(share=True, debug=True)