Spaces:

medelharchaoui
/

image_describer_withspeech

Running

medelharchaoui commited on Mar 10, 2024

Commit

9c6e277

verified ·

1 Parent(s): 7812e4e

adjust output audio and narrator output

Files changed (1) hide show

app.py CHANGED Viewed

@@ -13,15 +13,19 @@ def describe_image(file_path):
     img_text_pip_output = img_text_pipe(file_path)
     description_text = img_text_pip_output[0]['generated_text']
     narrated_text = narrator(description_text)
-    return narrated_text["audio"][0]
 iface = gr.Interface(fn=describe_image,
                      inputs=gr.Image(label="Input image",
                   type="pil"),
-                   outputs="audio"
                    )
 iface.launch()

     img_text_pip_output = img_text_pipe(file_path)
     description_text = img_text_pip_output[0]['generated_text']
+    print(description_text)
     narrated_text = narrator(description_text)
+    (narrated_text["sampling_rate"], narrated_text["audio"][0] )
+    return (narrated_text["sampling_rate"], narrated_text["audio"][0])
 iface = gr.Interface(fn=describe_image,
                      inputs=gr.Image(label="Input image",
                   type="pil"),
+                   outputs=gr.Audio(label="Narration", type="numpy",  autoplay=True)
                    )
 iface.launch()