Spaces:

tejas1243
/

stejas-kani-tts

Sleeping

tejas1243 commited on 20 days ago

Commit

55de385

verified ·

1 Parent(s): 66bccde

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,23 +1,28 @@
 import gradio as gr
 from diffusers import StableDiffusionPipeline
 import torch
-# Load the model (Stable Diffusion XL)
 pipe = StableDiffusionPipeline.from_pretrained("stabilityai/stable-diffusion-xl-base-1.0")
-pipe.to("cpu")  # CPU mode (free tier compatible)
-# Function to generate an image
-def generate_image(prompt):
     image = pipe(prompt).images[0]
-    return image
-# Gradio interface
 demo = gr.Interface(
-    fn=generate_image,
-    inputs=gr.Textbox(label="Enter your image prompt"),
-    outputs="image",
-    title="Stable Diffusion XL (Free CPU Version)",
-    description="Generate images for free using CPU mode on Hugging Face"
 )
 demo.launch()

 import gradio as gr
 from diffusers import StableDiffusionPipeline
 import torch
+from transformers import pipeline
+# 🎨 Load Stable Diffusion model
 pipe = StableDiffusionPipeline.from_pretrained("stabilityai/stable-diffusion-xl-base-1.0")
+pipe.to("cpu")
+# 🗣️ Load Text-to-Speech model
+tts = pipeline("text-to-speech", model="nineninesix/kani-tts-370m")
+# Image generation function
+def generate_media(prompt):
     image = pipe(prompt).images[0]
+    audio = tts(prompt)
+    return image, (audio["audio"],)
+# Gradio UI
 demo = gr.Interface(
+    fn=generate_media,
+    inputs=gr.Textbox(label="Enter your prompt"),
+    outputs=[gr.Image(label="Generated Image"), gr.Audio(label="AI Voice")],
+    title="AI Image + Voice Generator",
+    description="Generates an image with a matching AI voiceover using Stable Diffusion XL and KaniTTS"
 )
 demo.launch()